scikit-learn: проблемы на примере RFECV

У меня возникают трудности с пониманием приведенного примера RFECV в текущей документации. В сюжете это написано как "nb of misclassification", так что я ожидаю, что "чем меньше, тем лучше". Но в примере графика наилучшее было выбрано в качестве наивысшей оценки перекрестной проверки. Поэтому я, естественно, ожидаю, что это связано с точностью (в любом случае оценка говорит о точности в коде). Но тогда как оно становится выше 1?

Я немного запутался в том, как интерпретировать эти результаты. Буду признателен за любую помощь в этом.

Спасибо!

1 ответ

RFECV имеет полезную verbose вариант. Бег с verbose=2Вы можете видеть, что для двухкратной проверки значений, как в примере, grid_scores_ содержит сумму баллов обоих сгибов.

В общем, для n-кратной проверки, grid_scores_ сумма баллов складок делится на n-1 см. в коде. Кажется, это ошибка; см. несколько актуальный вопрос на трекере.

Другие вопросы по тегам