Атрибуты кластера с использованием hclust в R
У меня есть набор данных, который представляет собой двухмерные данные с именами столбцов в качестве атрибутов и строк в качестве элементов. Образец приведен ниже:
A1 A2 A3 A4 ....
Item1 0 1 0 0
Item2 0 0 0 1
Item3 1 1 0 0
....
Я использовал hclust (метод ward.D2) для создания кластерной дендрограммы в R. Я могу получить метки всех элементов в кластере. Как узнать список атрибутов (A1 A2 и т. Д.) Кластера, чтобы я мог определить, как эти элементы сошлись вместе?
Код, который я попробовал:
d <- vegdist(data,method="jaccard")
fit <- hclust(d,method="ward.D2")
plot(fit)
hcd <- as.dendrogram(fit)
plot(cut(hcd,h=3)$upper)
labels(cut(hcd, h=3)$lower[[1]])
1 ответ
Решение
Иерархическая кластеризация не обрабатывает столбцы.
Он работает на матрице расстояний - больше нет меток столбцов.
Вы можете искать бикластер вместо этого.