Почему hclust показывает инверсию здесь?
Вот три пункта и иерархическая кластеризация с использованием hclust
в R методом "центроид".
points <- data.frame(x = c(0, 1, 0.75),
y = c(0, 0, 1))
centroid <- hclust(dist(points), method = "centroid")
plot(centroid)
Полученная дендрограмма корректно объединяет первую и вторую точки. (Расстояние равно 1.) Центр тяжести первых двух точек находится в точке (0.5, 0).
Третья точка сливается на высоте 0,8903882, создавая инверсию (или разворот, как некоторые называют это). Фактически, третья точка находится на расстоянии 1.030776 от центроида, поэтому инверсии не должно быть.
Что мне здесь не хватает?
1 ответ
Это в основном из-за метода, который вы использовали, который является центроид. Выберите другой метод (монотонные методы), такие как Связь с одним полным сцеплением.