scikit-learn: проблемы на примере RFECV
У меня возникают трудности с пониманием приведенного примера RFECV в текущей документации. В сюжете это написано как "nb of misclassification", так что я ожидаю, что "чем меньше, тем лучше". Но в примере графика наилучшее было выбрано в качестве наивысшей оценки перекрестной проверки. Поэтому я, естественно, ожидаю, что это связано с точностью (в любом случае оценка говорит о точности в коде). Но тогда как оно становится выше 1?
Я немного запутался в том, как интерпретировать эти результаты. Буду признателен за любую помощь в этом.
Спасибо!
1 ответ
RFECV имеет полезную verbose
вариант. Бег с verbose=2
Вы можете видеть, что для двухкратной проверки значений, как в примере, grid_scores_
содержит сумму баллов обоих сгибов.
В общем, для n-кратной проверки, grid_scores_
сумма баллов складок делится на n-1
см. в коде. Кажется, это ошибка; см. несколько актуальный вопрос на трекере.