Метрика Скоринга для учёных LassoCV

Я использую функцию LassoCV от scikit-learn. Во время перекрестной проверки какая метрика оценки используется по умолчанию?

Я хотел бы, чтобы перекрестная проверка основывалась на "среднеквадратичной потере ошибок регрессии". Можно ли использовать этот показатель с LassoCV? Можно указать метрику оценки для LogisticRegressionCV, так что это может быть возможно и с LassoCV?

1 ответ

Решение

LassoCV использует R^2 в качестве метрики оценки. Из документов:

По умолчанию при поиске параметров используется функция оценки оценщика для оценки установки параметра. Это sklearn.metrics.accuracy_score для классификации и sklearn.metrics.r2_score для регрессии.

Чтобы использовать альтернативную метрику оценки, такую ​​как среднеквадратическая ошибка, необходимо использовать GridSearchCV или же RandomizedSearchCV (вместо LassoCV) и укажите scoring параметр как scoring='neg_mean_squared_error', Из документов:

Альтернативная функция оценки может быть указана с помощью параметра оценки для GridSearchCV, RandomizedSearchCV и многих специализированных инструментов перекрестной проверки, описанных ниже.

Я думаю, что принятый ответ неверен, поскольку он цитирует документацию Grid Search, но LassoCVиспользует пути регуляризации, а не поиск по сетке. Фактически на странице документации дляLassoCV, он говорит, что функция потерь:

(1 / (2 * n_samples)) * ||y - Xw||^2_2 + alpha * ||w||_1

Это означает, что это минимизация MSE (плюс термин LASSO).

Другие вопросы по тегам