Функция daisy из кластерного пакета возвращает ошибку в данных

Question

Функция daisy из кластерного пакета возвращает ошибку в данных

Я хочу использовать порядковые данные (1,2,3,4) из 59 наблюдаемых с 322 переменными и последовательностью, что в конечном итоге приведет к кластерному анализу. Я использую сценарий ниже для входного файла Excel (CSV). После ромашки появляется следующее сообщение об ошибке:

> Error in daisy(grb, stand = TRUE) :    ungültiger Typ character für
> Spaltennummern 1 In addition: Warning messages: 1: In data.matrix(x) :
> NAs introduced by coercion 2: In daisy(grb, stand = TRUE) :  
> Binärvariable 2, 3, 4,

Данные grb содержат имена строк в первом столбце и заголовки столбцов в первой строке. Дейзи, кажется, думает, что она должна использовать первый столбец: как я могу сказать, что нет, чтобы сделать это? Входные данные выглядят хорошо.

Во-вторых, маргаритка считает данные двоичными файлами, но они являются oridnals, 1-4. Как это исправить? Любая помощь с благодарностью.

Автор сценария:

library(readr)
grb <- read_delim("~/R/Projects/Datasets/Ges.csv", 
                  ";", escape_double = FALSE, trim_ws = TRUE)
attach(grb)
library(cluster)
data(grb)
head(grb, 2)
d.d <- daisy(grb, stand = TRUE)
grb.hc <- hclust(d.d, method = "ward.D2")
library("factoextra")
fviz_dend(grb.hc, cex=.5, horiz = TRUE)

0

r r-daisy

Источник

user8928198 12 ноя '17 в 14:48

0 ответов

Другие вопросы по тегам r r-daisy