Как построить многомерные данные в кластерах

У меня есть набор данных, который имеет 6497 экземпляров, 12 атрибутов и переменную класса с именем q (качество). Значения класса могут варьироваться от 3 до 9. Данные можно скачать в формате CSV отсюда

Я использую K-среднее для разделения данных на 3 кластера

set.seed(1234)
nr <- NROW(wine$.row)
ind <- sample(nr, 0.66 * nr, replace = FALSE) #66%
w_clus3 <- kmeans(wine[ind, 2:12], 3)
matrix3 <- table(cl_predict(w_clus3, wine[-ind,2:12 ]),wine$q[-ind])

Есть ли способ, как я могу использовать Clusplot или любой другой визуальный график, чтобы показать, как данные были разделены на три кластера?

Я пытался, но я получаю ошибки.

clusplot(wine[2:12], w_clus3$cluster, color=TRUE, shade=TRUE,labels=2, lines=0)

Если есть слишком много измерений... как я могу просто показать несколько атрибутов и как они были разделены на кластеры.

1 ответ

Как насчет уменьшения размеров, таких как PCA? Чем у вас может быть какой-то визуализируемый набор функций.

Другие вопросы по тегам