R: Иерархическая кластеризация

Question

R: Иерархическая кластеризация

Допустим, у нас есть следующий набор данных

set.seed(144) 
dat <- matrix(rnorm(100), ncol=5)

Следующая функция создает все возможные комбинации столбцов и удаляет первый

(combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,])
#     Var1  Var2  Var3  Var4  Var5
# 2   TRUE FALSE FALSE FALSE FALSE
# 3  FALSE  TRUE FALSE FALSE FALSE
# 4   TRUE  TRUE FALSE FALSE FALSE
# ...
# 31 FALSE  TRUE  TRUE  TRUE  TRUE
# 32  TRUE  TRUE  TRUE  TRUE  TRUE

Последний шаг - запустить кластеризацию k-средних для каждого подмножества столбцов, что является простым приложением apply (нам нужно 3 кластера в каждой из моделей kmeans):

models <- apply(combinations, 1, function(x) kmeans(dat[,x], 3))

У меня вопрос, как запустить иерархическую кластеризацию вместо kmeans для каждого подмножества столбцов. Любая идея?

-1

r cluster-analysis hierarchical-clustering hclust

Источник

user4712350 29 май '15 в 09:18

1 ответ

Решение

Другие вопросы по тегам r cluster-analysis hierarchical-clustering hclust

user2030296 29 май '15 в 09:48 2015-05-29 09:48 · Accepted Answer · 2015-05-29 09:48

Вы можете использовать hclust

models <- apply(combinations, 1, function(x) hclust(dist(dat[,x])))
clusters <- apply(combinations, 1, function(x) cutree(hclust(dist(dat[,x])), k = 3))

1

Источник

user2030296 29 май '15 в 09:48