Как построить многомерные данные в кластерах
У меня есть набор данных, который имеет 6497 экземпляров, 12 атрибутов и переменную класса с именем q (качество). Значения класса могут варьироваться от 3 до 9. Данные можно скачать в формате CSV отсюда
Я использую K-среднее для разделения данных на 3 кластера
set.seed(1234)
nr <- NROW(wine$.row)
ind <- sample(nr, 0.66 * nr, replace = FALSE) #66%
w_clus3 <- kmeans(wine[ind, 2:12], 3)
matrix3 <- table(cl_predict(w_clus3, wine[-ind,2:12 ]),wine$q[-ind])
Есть ли способ, как я могу использовать Clusplot или любой другой визуальный график, чтобы показать, как данные были разделены на три кластера?
Я пытался, но я получаю ошибки.
clusplot(wine[2:12], w_clus3$cluster, color=TRUE, shade=TRUE,labels=2, lines=0)
Если есть слишком много измерений... как я могу просто показать несколько атрибутов и как они были разделены на кластеры.
1 ответ
Как насчет уменьшения размеров, таких как PCA? Чем у вас может быть какой-то визуализируемый набор функций.