Как интерпретировать дендрограмму из иерархической кластеризации, чтобы найти оптимальное количество кластеров?

При просмотре этого, как мы узнаем, чтобы найти оптимальное количество кластеров? Я использовал K-средства и нашел "колено" на графике, которое показало оптимальную точку, но у меня возникают проблемы с вычислением этого только по дендрограмме.

1 ответ

Интерпретация варьируется в зависимости от вашей метрики и используемой связи.

Но в целом вы хотите сохранить ветви, которые имеют "много" наблюдений и имеют "большое" расстояние выше (для следующего слияния).

Другие вопросы по тегам