Оценка максимального правдоподобия в склеарне
В моем проекте я использую GridSearchCV
в sklearn
исчерпывающий поиск по указанным значениям параметров для модели, чтобы найти наилучшие возможные значения параметров. Я просто протестировал это в RandomForestClassifier и помог мне найти лучшее max_depth
а также n_estimators
, Исходя из этого, у меня есть два вопроса:
- Есть ли
GridSearchCV
использовать концепцию оценки максимального правдоподобия (MLE) под капотом? - Вместо того, чтобы использовать
GridSearchCV
Для каждой модели есть ли метод, который я могу использовать, чтобы выбрать лучшую модель для моего набора данных? Я думаю, что это в рамках концепции выбора модели, но я не знаю, как использовать его черезsklearn
,
Спасибо
1 ответ
Использует ли GridSearchCV концепцию оценки максимального правдоподобия (MLE) под капотом?
MLE является вероятностным рассуждением, поэтому его можно применять только к вероятностным моделям. GridSearchCV не основан на MLE, это простой способ выбора модели на основе прямой оценки ошибки теста. Для конкретной модели ей может быть назначено число, представляющее, насколько она хороша - для многих моделей вы можете просто выбрать тот, у которого наибольшее число (самая высокая предполагаемая сила обобщения).
Вместо использования GridSearchCV для каждой модели, есть ли метод, который я могу использовать, чтобы выбрать лучшую модель для моего набора данных? Я думаю, что это в соответствии с концепцией выбора модели, но я не знаю, как использовать его через sklearn.
Их много, но в Sklearn реализованы только различные сплиттеры для тестирования поездов (CV, рандом и т. Д.); вместо этого вы можете рассмотреть другие библиотеки, которые поддерживают:
- Байесовская оптимизация
- Техника оценки дерева Парзена
Какие более продвинутые методы поиска хороших гиперпараметров (а не просто проверка уже существующих).