В чем разница между настройками NMI в scikit узнать

Если вы реализуете документацию scikit-learn в контролируемой оценке кластеризации, у NMI есть много опций Average_method, и когда я их изменю, ответ на самом деле изменится.

average_method : string, optional (default: 'warn')
    How to compute the normalizer in the denominator. Possible options
    are 'min', 'geometric', 'arithmetic', and 'max'.
    If 'warn', 'geometric' will be used. The default will change to
    'arithmetic' in version 0.22.

    .. versionadded:: 0.20

в чем разница?

1 ответ

Решение

Речь идет о том, как рассчитать знаменатель формулировки. Для нормализованной взаимной информации и скорректированной взаимной информации нормализующее значение обычно является некоторым обобщенным средним значением энтропий каждой кластеризации. Существуют различные обобщенные средства, и не существует твердых правил для предпочтения одного над другими. Решение в значительной степени основано на поле; например, при обнаружении сообщества среднее арифметическое является наиболее распространенным. Каждый метод нормализации обеспечивает "качественно сходное поведение" [YAT2016]. В нашей реализации это контролируется параметром average_method.

Другие вопросы по тегам