Описание тега r-daisy
NoneDaisy - это функция из пакета кластеров, вычисляющая все попарные несходства (расстояния) между наблюдениями в наборе данных.
0
ответов
Как выделить вектор больше 2Гб
Я пытался выполнить команду в R, когда я получил эту ошибку: d <- daisy(demo, metric = "gower",stand = FALSE, type = list(), weights = 1) Error: cannot allocate vector of size 2.3 Gb Есть ли способ выделить больше памяти для R? Мой 64-битный R на…
24 июн '15 в 10:16
0
ответов
Функция daisy из кластерного пакета возвращает ошибку в данных
Я хочу использовать порядковые данные (1,2,3,4) из 59 наблюдаемых с 322 переменными и последовательностью, что в конечном итоге приведет к кластерному анализу. Я использую сценарий ниже для входного файла Excel (CSV). После ромашки появляется следую…
12 ноя '17 в 14:48
0
ответов
Предупреждение в функции ромашки в R
Я использовал функцию "маргаритка" для вычисления расстояния, но встречает следующее предупреждение: In cluster::daisy(mixusefull2) :binary variable(s) 6 treated as interval scaled Мои данные и их типы следующие: str(mixusefull2) 'data.frame': 2 obs…
06 июн '18 в 13:36
1
ответ
Вычислить матрицу различий для больших данных
Я пытаюсь вычислить матрицу различий на основе большого фрейма данных с числовыми и категориальными характеристиками. Когда я бегу daisy Функция из пакета кластера я получаю сообщение об ошибке: Ошибка: невозможно выделить вектор размера X. В моем с…
01 дек '17 в 09:29
1
ответ
Начальные значения дерева отличаются от PAST
Когда я вычисляю загруженное дерево в R I, я получаю разные значения, чем когда я использую PAST ( http://folk.uio.no/ohammer/past/). Как я могу получить выходные данные для совпадения из двух программ? Вот что я делаю в R (данные ниже): library("ap…
17 дек '14 в 13:19
1
ответ
R Ошибка пакета кластера Длинные векторы функции Daisy() (аргумент 11) не поддерживаются в.C
Пытаясь преобразовать data.frame с числовыми, номинальными и NA значениями в матрице различий, используя daisy функция от cluster пакет в R. Моя цель заключается в создании матрицы различий до применения кластеризации k-средних для сегментации клиен…
18 июн '14 в 05:54
0
ответов
R Daisy Gower сходства: Рассчитать для одного наблюдения, а не попарно
Я хотел бы вычислить сходства Гауэра для 1 наблюдения против нескольких (400k+) наблюдений, в отличие от полного парного анализа. Причина в том, что меня интересует, насколько новое наблюдение похоже на существующие примеры, чтобы найти похожие исто…
03 июл '18 в 15:56
0
ответов
Нечеткая кластеризация в R с данными опроса
У меня есть данные опроса, которые имеют 18,406 строк и 247 столбцов. У него слишком много вопросов по шкале Ликерта. И, конечно, у него есть NA. Я проверил похожие вопросы и увидел ответ в этой теме: кластерный анализ в R с отсутствующими данными, …
09 авг '15 в 16:28
2
ответа
Python-эквивалент daisy() в кластерном пакете R
У меня есть набор данных, который содержит как категориальные (номинальные и порядковые), так и числовые атрибуты. Я хочу вычислить (раз) матрицу сходства по моим наблюдениям, используя эти смешанные атрибуты. Используя функцию daisy() кластерного п…
15 окт '14 в 16:37
0
ответов
Метод локтя с использованием hclus.scree, ошибка не может найти функцию
Я нашел несколько документов, которые используют функцию "hclus.scree", чтобы использовать метод elbow для определения количества кластеров. Однако R не может найти функцию hclus.scree. Это версия R вещь? Я перепробовал несколько библиотек, но, возм…
18 фев '16 в 18:10
1
ответ
Вычисление скалярного произведения между всеми парами столбцов в кадре данных
У меня есть R data frame какие столбцы являются логическими переменными. Мне нужно сделать какой-то точечный продукт между всеми возможными парами столбцов. Это вытекает из анализа текстового корпуса, где фрейм данных указывает, какие термины (строк…
24 май '14 в 21:15
2
ответа
Преобразование факторов в типы двоичных асимметричных переменных
Я хочу конвертировать некоторые типы переменных в R от факторов к двоичным типам асимметричных переменных. Я успешно преобразовал некоторые из моих данных из факторов в упорядоченные факторы, используя этот синтаксис: mydata[,200] <-as.ordered(my…
26 апр '18 в 16:09
1
ответ
Получение ошибки "недопустимый символ типа" с ромашкой
У меня есть фрейм данных со смешанными типами данных (целочисленные, символьные и логические), которые я пытаюсь кластеризовать с помощью ромашки. Я использую: gower_dist <- daisy(relchoice, metric = "gower") и получать: Error in daisy(relchoice,…
26 сен '18 в 17:11
1
ответ
Как вычислить сходство строк во фрейме данных с неравномерным сходством между категориями атрибута?
Я вычисляю сходство строк во фрейме данных с помощью показателя сходства Гауэра, как показано ниже. library(cluster) myDF <- data.frame(x1 = 1:10, x2 = c(rep("a", 4), rep("b", 3), rep("c", 3)), x3 = c(rep("A", 2), rep("B", 2), "C", "D", rep("E", …
12 сен '17 в 01:27
1
ответ
Как нарисовать многоугольник / выпуклый корпус вокруг кластеров Partitioned Around Medoids (PAM) в R?
Хорошего дня Можно ли построить график на основе результатов анализа кластеризации различий PAM с полигонами, нарисованными вокруг внешней точки кластеров? В настоящее время я добился чего-то подобного, используя функцию clusterplot, однако мне боль…
15 май '17 в 23:28
1
ответ
Кластерный анализ с ромашкой
Я пытаюсь выполнить иерархический кластерный анализ с помощью RStudio, используя пакет daisy, Это мой набор данных: data.frame':341 obs. of 28 variables: $ Impo_Env : Ord.factor w/ 3 levels "Low"<"Med"<"High": 3 2 3 2 3 2 3 3 2 3 ... $ Compara…
10 фев '16 в 22:12
1
ответ
Метка оси X не отображается на кластеризованной дендрограмме в ggplot
Я выполнил кластеризацию дендрограммы, следуя предыдущему коду, который нашел в сети, но ось x на графике не отображается. Я хотел бы, чтобы значение отличия отображалось на оси X, но я не добился успеха. females<-cervidae[cervidae$Sex=="female",…
12 сен '17 в 12:36
1
ответ
R - Как ускорить расчет евклидова расстояния на очень большом наборе данных
Сообщество, У меня есть очень большой набор данных, содержащий 3 столбца с координатами (x, y, z) и 24 x 10^6 строк. Мне нужно вычислить евклидово расстояние между всеми строками и первым рядом, которое равно 0, 0, 0. С циклом ниже это занимает очен…
07 ноя '14 в 08:46
0
ответов
Выберите конкретные объекты / строки из карты тепла в R
У меня смешанный тип данных, который содержит числовые и категориальные атрибуты, к которым я планирую применить кластерные алгоритмы. В качестве первого шага я создал матрицу расстояний, используя функцию daisy() и меру расстояния Гауэра. Я отобраз…
08 сен '15 в 20:49
0
ответов
Computing Silhouette Width - особый случай
Я полностью переформулирую этот вопрос, следуя совету @MrFlick. Предположим, у меня есть data.frame как следующее set.seed(1) group<-(rep(1:10, sample(50:200, 10, replace=T))) gender<-factor((sample(0:1, 1328, replace=T, prob=c(0.55, 0.45)))) …
18 июл '14 в 21:13