Описание тега r-daisy

NoneDaisy - это функция из пакета кластеров, вычисляющая все попарные несходства (расстояния) между наблюдениями в наборе данных.
0 ответов

Как выделить вектор больше 2Гб

Я пытался выполнить команду в R, когда я получил эту ошибку: d <- daisy(demo, metric = "gower",stand = FALSE, type = list(), weights = 1) Error: cannot allocate vector of size 2.3 Gb Есть ли способ выделить больше памяти для R? Мой 64-битный R на…
24 июн '15 в 10:16
0 ответов

Функция daisy из кластерного пакета возвращает ошибку в данных

Я хочу использовать порядковые данные (1,2,3,4) из 59 наблюдаемых с 322 переменными и последовательностью, что в конечном итоге приведет к кластерному анализу. Я использую сценарий ниже для входного файла Excel (CSV). После ромашки появляется следую…
12 ноя '17 в 14:48
0 ответов

Предупреждение в функции ромашки в R

Я использовал функцию "маргаритка" для вычисления расстояния, но встречает следующее предупреждение: In cluster::daisy(mixusefull2) :binary variable(s) 6 treated as interval scaled Мои данные и их типы следующие: str(mixusefull2) 'data.frame': 2 obs…
06 июн '18 в 13:36
1 ответ

Вычислить матрицу различий для больших данных

Я пытаюсь вычислить матрицу различий на основе большого фрейма данных с числовыми и категориальными характеристиками. Когда я бегу daisy Функция из пакета кластера я получаю сообщение об ошибке: Ошибка: невозможно выделить вектор размера X. В моем с…
01 дек '17 в 09:29
1 ответ

Начальные значения дерева отличаются от PAST

Когда я вычисляю загруженное дерево в R I, я получаю разные значения, чем когда я использую PAST ( http://folk.uio.no/ohammer/past/). Как я могу получить выходные данные для совпадения из двух программ? Вот что я делаю в R (данные ниже): library("ap…
17 дек '14 в 13:19
1 ответ

R Ошибка пакета кластера Длинные векторы функции Daisy() (аргумент 11) не поддерживаются в.C

Пытаясь преобразовать data.frame с числовыми, номинальными и NA значениями в матрице различий, используя daisy функция от cluster пакет в R. Моя цель заключается в создании матрицы различий до применения кластеризации k-средних для сегментации клиен…
18 июн '14 в 05:54
0 ответов

R Daisy Gower сходства: Рассчитать для одного наблюдения, а не попарно

Я хотел бы вычислить сходства Гауэра для 1 наблюдения против нескольких (400k+) наблюдений, в отличие от полного парного анализа. Причина в том, что меня интересует, насколько новое наблюдение похоже на существующие примеры, чтобы найти похожие исто…
03 июл '18 в 15:56
0 ответов

Нечеткая кластеризация в R с данными опроса

У меня есть данные опроса, которые имеют 18,406 строк и 247 столбцов. У него слишком много вопросов по шкале Ликерта. И, конечно, у него есть NA. Я проверил похожие вопросы и увидел ответ в этой теме: кластерный анализ в R с отсутствующими данными, …
09 авг '15 в 16:28
2 ответа

Python-эквивалент daisy() в кластерном пакете R

У меня есть набор данных, который содержит как категориальные (номинальные и порядковые), так и числовые атрибуты. Я хочу вычислить (раз) матрицу сходства по моим наблюдениям, используя эти смешанные атрибуты. Используя функцию daisy() кластерного п…
15 окт '14 в 16:37
0 ответов

Метод локтя с использованием hclus.scree, ошибка не может найти функцию

Я нашел несколько документов, которые используют функцию "hclus.scree", чтобы использовать метод elbow для определения количества кластеров. Однако R не может найти функцию hclus.scree. Это версия R вещь? Я перепробовал несколько библиотек, но, возм…
18 фев '16 в 18:10
1 ответ

Вычисление скалярного произведения между всеми парами столбцов в кадре данных

У меня есть R data frame какие столбцы являются логическими переменными. Мне нужно сделать какой-то точечный продукт между всеми возможными парами столбцов. Это вытекает из анализа текстового корпуса, где фрейм данных указывает, какие термины (строк…
24 май '14 в 21:15
2 ответа

Преобразование факторов в типы двоичных асимметричных переменных

Я хочу конвертировать некоторые типы переменных в R от факторов к двоичным типам асимметричных переменных. Я успешно преобразовал некоторые из моих данных из факторов в упорядоченные факторы, используя этот синтаксис: mydata[,200] <-as.ordered(my…
26 апр '18 в 16:09
1 ответ

Получение ошибки "недопустимый символ типа" с ромашкой

У меня есть фрейм данных со смешанными типами данных (целочисленные, символьные и логические), которые я пытаюсь кластеризовать с помощью ромашки. Я использую: gower_dist <- daisy(relchoice, metric = "gower") и получать: Error in daisy(relchoice,…
26 сен '18 в 17:11
1 ответ

Как вычислить сходство строк во фрейме данных с неравномерным сходством между категориями атрибута?

Я вычисляю сходство строк во фрейме данных с помощью показателя сходства Гауэра, как показано ниже. library(cluster) myDF <- data.frame(x1 = 1:10, x2 = c(rep("a", 4), rep("b", 3), rep("c", 3)), x3 = c(rep("A", 2), rep("B", 2), "C", "D", rep("E", …
1 ответ

Как нарисовать многоугольник / выпуклый корпус вокруг кластеров Partitioned Around Medoids (PAM) в R?

Хорошего дня Можно ли построить график на основе результатов анализа кластеризации различий PAM с полигонами, нарисованными вокруг внешней точки кластеров? В настоящее время я добился чего-то подобного, используя функцию clusterplot, однако мне боль…
15 май '17 в 23:28
1 ответ

Кластерный анализ с ромашкой

Я пытаюсь выполнить иерархический кластерный анализ с помощью RStudio, используя пакет daisy, Это мой набор данных: data.frame':341 obs. of 28 variables: $ Impo_Env : Ord.factor w/ 3 levels "Low"<"Med"<"High": 3 2 3 2 3 2 3 3 2 3 ... $ Compara…
10 фев '16 в 22:12
1 ответ

Метка оси X не отображается на кластеризованной дендрограмме в ggplot

Я выполнил кластеризацию дендрограммы, следуя предыдущему коду, который нашел в сети, но ось x на графике не отображается. Я хотел бы, чтобы значение отличия отображалось на оси X, но я не добился успеха. females<-cervidae[cervidae$Sex=="female",…
12 сен '17 в 12:36
1 ответ

R - Как ускорить расчет евклидова расстояния на очень большом наборе данных

Сообщество, У меня есть очень большой набор данных, содержащий 3 столбца с координатами (x, y, z) и 24 x 10^6 строк. Мне нужно вычислить евклидово расстояние между всеми строками и первым рядом, которое равно 0, 0, 0. С циклом ниже это занимает очен…
07 ноя '14 в 08:46
0 ответов

Выберите конкретные объекты / строки из карты тепла в R

У меня смешанный тип данных, который содержит числовые и категориальные атрибуты, к которым я планирую применить кластерные алгоритмы. В качестве первого шага я создал матрицу расстояний, используя функцию daisy() и меру расстояния Гауэра. Я отобраз…
08 сен '15 в 20:49
0 ответов

Computing Silhouette Width - особый случай

Я полностью переформулирую этот вопрос, следуя совету @MrFlick. Предположим, у меня есть data.frame как следующее set.seed(1) group<-(rep(1:10, sample(50:200, 10, replace=T))) gender<-factor((sample(0:1, 1328, replace=T, prob=c(0.55, 0.45)))) …
18 июл '14 в 21:13