Описание тега hclust

R function from {stats} package - hierarchical cluster analysis on a set of dissimilarities and methods for analyzing it.
1 ответ

Почему hclust показывает инверсию здесь?

Вот три пункта и иерархическая кластеризация с использованием hclust в R методом "центроид". points <- data.frame(x = c(0, 1, 0.75), y = c(0, 0, 1)) centroid <- hclust(dist(points), method = "centroid") plot(centroid) Полученная дендрограмма к…
03 дек '18 в 22:20
1 ответ

В чем разница между сегментами (от сегментации) и классами (от иерархической кластеризации)

Я работаю над сегментированием средств с помощью R! Теперь я в замешательстве! Мой первый вопрос - как я могу кластеризовать файл сегментации (определяя каждый сегмент как суперпиксель), а во-вторых, как я могу определить, сколько объектов и сколько…
03 июл '17 в 10:10
1 ответ

Сохранить наблюдение, принадлежащее кластеру в R

Простой пример с набором данных iris. Я должен использовать apcluster library library("apcluster") #use dist() create a negative SimilarityMatrix sim<-negDistMat(iris[,1:4],r=2) #run the clusteralgorythm and create apclustert object apiris1 apiri…
1 ответ

Как построить метку с общими чертами между группами, используя R?

Когда я использую команду hclust в R, чтобы построить дендрограмму, я получаю ось y, помеченную как Высота. Однако я хотел бы обозначить эту ось уровнями сходства между группами в моем наборе данных, что-то вроде изображения ниже. Как мне этого доби…
13 янв '13 в 21:24
2 ответа

Порядковые данные кластера

Я хочу сделать кластеризацию моих данных (kmeans или hclust) на языке R (кодирование). Мои данные являются порядковыми, что означает, что данные представляют собой шкалу Лайкерта для измерения причин эскалации затрат (у меня есть 41 причина "перемен…
17 апр '13 в 01:44
2 ответа

Использование cluster.stats с hclust

У меня проблема с использованием cluster.stats на двух разных кластерах hclust. Это не возможно? У меня версия 0.99.491 - © 2009-2015 RStudio, Inc. с установленными ниже пакетами: mylib <- "/Users/Klaus/R Packages/"; mylib install.packages("NbClu…
07 апр '16 в 14:53
1 ответ

R: Иерархическая кластеризация

Допустим, у нас есть следующий набор данных set.seed(144) dat <- matrix(rnorm(100), ncol=5) Следующая функция создает все возможные комбинации столбцов и удаляет первый (combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,])…
2 ответа

Список кластеризации для функции hclust

С помощью plot(hclust(dist(x))) Метод, я смог нарисовать карту дерева кластеров. Оно работает. Тем не менее, я хотел бы получить список всех кластеров, а не древовидную диаграмму, потому что у меня огромное количество данных (например, 150 тыс. Узло…
29 июн '11 в 09:05
1 ответ

Сопоставьте и добавьте номер кластера к исходным данным

Я использую обычный метод для создания проекта иерархической кластеризации. mydata.dtm <- TermDocumentMatrix(mydata.corpus) mydata.dtm2 <- removeSparseTerms(mydata.dtm, sparse=0.98) mydata.df <- as.data.frame(inspect(mydata.dtm2)) mydata.df…
07 фев '15 в 03:07
1 ответ

Как сгруппировать около 9000 последовательностей чисел, используя R?

У меня есть CSV-файл, содержащий около 9000 числовых последовательностей, которые мне нужно кластеризовать. Первые 6 строк CSV выглядят так id, sequence "1","1 2" "2","3 4 5 5 6 6 7 8 9 10 11 12 13 8 14 10 10 15 11 12 16" "3","17 18 19 20 5 5 20 5 5…
19 дек '18 в 17:22
0 ответов

Plotting переменные в соответствии с евклидовым расстоянием от опорной переменной в г

У меня есть небольшой набор данных следующим образом: Group.1 Dim1 Dim2 Dim3 Dim4 1 2.58092308 -0.77728205 2.84851282 -0.5108718 2 7.64928205 3.33953846 1.796 -2.1537949 3 0.06005405 -0.08967568 -0.05810811 3.1354054 4 -1.01599057 -1.67231132 -1.758…
05 янв '18 в 09:03
0 ответов

Чувствительность решения иерархической кластеризации в r

Я использую иерархическую кластеризацию, чтобы извлечь определенное количество кластеров из набора данных. Моя цель - проверить, насколько надежно кластерное решение, когда я уменьшаю объем используемых данных (и, возможно, включаемых переменных). Я…
17 янв '19 в 12:34
1 ответ

Извлечение членов из кластеров (листьев)

Как только вы создаете кластеры, используя hclust, затем cutree указывать нисходящие кластеры; Как вы можете получить членов, образующих различные кластеры? Предположим, вы создали простой иерархический кластер. Какая команда может извлекать элемент…
23 мар '12 в 10:36
1 ответ

Атрибуты кластера с использованием hclust в R

У меня есть набор данных, который представляет собой двухмерные данные с именами столбцов в качестве атрибутов и строк в качестве элементов. Образец приведен ниже: A1 A2 A3 A4 .... Item1 0 1 0 0 Item2 0 0 0 1 Item3 1 1 0 0 .... Я использовал hclust …
22 фев '16 в 10:57
2 ответа

Предел размера hclust?

Я новичок в R. Я пытаюсь запустить hclust() примерно на 50 тыс. Элементов. У меня есть 10 столбцов для сравнения и 50К строк данных. Когда я попытался назначить матрицу расстояний, я получаю: "Невозможно выделить вектор размером 5 ГБ". Есть ли огран…
25 окт '12 в 21:20
2 ответа

Кластеризация на основе совместного использования

Я хотел бы кластеризовать данные на основе ключевого слова совместного использования, используя R. Я столкнулся с 2 трудностями по сравнению с другими постами. Слова имеют разные уровни иерархии Ключевые слова не обязательно отображаются в порядке и…
1 ответ

Выбор кластеров ниже определенной высоты в дендрограмме R, но только если кластер больше единицы

Я хочу написать некоторый простой код, который будет выбирать для определенных кластеров ниже пороговой высоты и выделять их (либо с помощью прямоугольника, либо по цвету). До сих пор я использовал cutree, который выбирает кластеры, которые мне нужн…
3 ответа

Срез дерева и прямоугольники вокруг скоплений для горизонтальной дендрограммы в R

Я пытаюсь представить результаты иерархической кластеризации в R как дендрограмма, с прямоугольниками, идентифицирующими кластеры. Следующий код выполняет трюк для вертикальной дендрограммы, но для горизонтальной дендрограммы, (horiz=TRUE), прямоуго…
10 июн '14 в 11:55
1 ответ

dist в R может обрабатывать только фреймы данных, векторы, матрицы и списки

Я пытаюсь запустить этот код, чтобы получить иерархическую кластеризацию для набора данных о точках оружия из базы данных временных рядов UCR. Однако я сталкиваюсь с этой ошибкой. Любая помощь? library(dtw) set.seed(6218) n <- 10 sc <- read.ta…
30 сен '15 в 18:10
1 ответ

Ошибка в as.dendrogram

Я пытаюсь сделать dendrpgram, используя большие данные Я использую статистику, библиотеки phyclust, distances <- phyclust.edist(Data[,],edist.model = .edist.model[3]) dataHClust <- hclust(distances, "ave") dhc <- as.dendrogram(dataHClust) h…
09 дек '12 в 14:28