Метрика Скоринга для учёных LassoCV
Я использую функцию LassoCV от scikit-learn. Во время перекрестной проверки какая метрика оценки используется по умолчанию?
Я хотел бы, чтобы перекрестная проверка основывалась на "среднеквадратичной потере ошибок регрессии". Можно ли использовать этот показатель с LassoCV? Можно указать метрику оценки для LogisticRegressionCV, так что это может быть возможно и с LassoCV?
1 ответ
LassoCV
использует R^2 в качестве метрики оценки. Из документов:
По умолчанию при поиске параметров используется функция оценки оценщика для оценки установки параметра. Это sklearn.metrics.accuracy_score для классификации и sklearn.metrics.r2_score для регрессии.
Чтобы использовать альтернативную метрику оценки, такую как среднеквадратическая ошибка, необходимо использовать GridSearchCV
или же RandomizedSearchCV
(вместо LassoCV
) и укажите scoring
параметр как scoring='neg_mean_squared_error'
, Из документов:
Альтернативная функция оценки может быть указана с помощью параметра оценки для GridSearchCV, RandomizedSearchCV и многих специализированных инструментов перекрестной проверки, описанных ниже.
Я думаю, что принятый ответ неверен, поскольку он цитирует документацию Grid Search, но LassoCV
использует пути регуляризации, а не поиск по сетке. Фактически на странице документации дляLassoCV
, он говорит, что функция потерь:
(1 / (2 * n_samples)) * ||y - Xw||^2_2 + alpha * ||w||_1
Это означает, что это минимизация MSE (плюс термин LASSO).