Склеарн: распространение аффинности на python - есть ли метод для вычисления ошибки в кластерах?
Просматривая документы для sklearn.cluster и Affinity Propagation, я не вижу ничего, что могло бы вычислить ошибку в кластере. Это существует или это то, что я должен написать сам?
Обновление: позвольте мне предложить возможную идею:
С помощью Affinity Propagation у нас есть матрица различий (это матрица, которая измеряет, насколько каждая строка отличается от другой). Когда AP закончен, у меня есть все назначения меток, к какому кластеру они принадлежат. Что если я взял измерение различий из матрицы? Например, скажем, в матрице 10x10 точка 3 - это мой кластер, а метка 4 назначена для примера 3. Различие между центроидом и меткой, например, -5. Допустим, этому центроиду присвоены еще две метки с различием -3 и -8 соответственно. Теперь, если я сказал, общая ошибка -16/3. Если у меня есть другой кластер с измерениями различий -2, -3, -2, -3, -2, -3 = -15/6. Это, кажется, обеспечивает измерение потенциальной ошибки.
1 ответ
Я не думаю, что есть общепринятое определение "ошибки", которое имело бы смысл в контексте распространения аффинности, которое является методом, основанным на сходстве.
Ошибки хорошо работают с методами, основанными на координатах, такими как k-means, но на AP у нас может не быть координат.