Кластеризация SAS Enterprise Miner - Проблемы с CCC

Я пытаюсь найти оптимальный размер кластера, используя критерий узла кластера и CCC.

Параметр "Автоматически" (по умолчанию) настраивает SAS Enterprise Miner для автоматического определения оптимального количества кластеров для создания с использованием метода Ward или Centroid. Однако у меня есть некоторые серьезные проблемы с автоматическим методом, выбором "оптимального" размера кластера и статистикой. Были выбраны следующие параметры: Кластерный метод =Ward, Prelim Max=50, Min=5, Final Max=50, CCC Cutoff=3.

Обратите внимание на следующий результат узла кластера. Скриншот результатов узла кластера,

Выходные данные показывают три кандидата для оптимального числа кластеров k=6, 10 и 46 с CCC=-104, -80 и 163. Был выбран лучший, т.е. k=46 с CCC=163. В то же время в отчете "Статистика кластера" указывается, что результирующее значение CCC составляло 294, однако максимальное значение CCC в доступном диапазоне составляло всего 163 (из k <= 50). Интересно, что когда предварительный максимум постепенно увеличивается до 500, расхождение между двумя зарегистрированными значениями CCC становится все меньше.

Показатели CCC, показанные в выходных данных, соответствуют диаграмме и выбору оптимального k для кластеризации. Значение CCC в таблице статистики кластера - чистая фантазия, и я не вижу возможности перевести ее во что-либо значимое.

Что-то не так с моим анализом?

PS Я прочитал справку Cluster Node.

0 ответов

Другие вопросы по тегам