Как интерпретировать результат кластеризации
здесь я использую модуль pycaret для создания модели kmean
вот фрагмент кода.
kmean=create_model('kmeans')
kmean_result=assign_model(kmean)
kmean_result.head()
выход:
CustomerID Gender Age Annual Income (k$) Spending Score (1-100) Cluster
0 51 Female 49 42 52 Cluster 1
1 128 Male 40 71 95 Cluster 3
2 38 Female 30 34 73 Cluster 0
3 150 Male 34 78 90 Cluster 3
4 20 Female 35 23 98 Cluster 0
построение графика распределения с помощью pycaret:
plot_model(kmea,plot='distribution')
Вывод plot_model:
[![enter image description here][1]][1]
[1]: https://i.stack.imgur.com/0UqgV.png
Я делаю сегментацию клиентов с использованием данных Mall_Coustomers из Kaggle, я хочу сегментировать клиента по годовому доходу и показателю расходов, я получаю 4 кластера после нанесения его на график, но проблема в том, как я узнаю, какой кластер принадлежит к какой группе, там нет меток, только кластер 0, кластер 1 и т. д., как я буду его интерпретировать, какой кластер из какой сегментированной группы.
любая помощь будет высоко оценена, так как я полностью застрял и сбит с толку с недели.