Классификация K-средних

У меня есть набор данных, который я знаю, имеет 3 класса. Скажем, я хочу выполнить классификацию k-средних для этого набора данных с k=10. Я бы получил 10 кластеров. Как мне объединить эти 10 кластеров в 3 класса и на основании каких правил я бы это сделал (например, метрики расстояния)?

Большое спасибо

1 ответ

Вы можете снова запустить k-means на ваших кластерах, на этот раз установив k=3. Или вы можете выполнить максимизацию ожидания на них. Или вы можете использовать грубую силу и протестировать все 120 способов объединения 10 кластеров в 3.

Правильный способ сделать это - установить k = 3 с самого начала. Решение k-средних с неправильным набором классов может быть очень плохим.

Другие вопросы по тегам