Оценка максимального правдоподобия в склеарне

В моем проекте я использую GridSearchCV в sklearn исчерпывающий поиск по указанным значениям параметров для модели, чтобы найти наилучшие возможные значения параметров. Я просто протестировал это в RandomForestClassifier и помог мне найти лучшее max_depth а также n_estimators, Исходя из этого, у меня есть два вопроса:

  1. Есть ли GridSearchCV использовать концепцию оценки максимального правдоподобия (MLE) под капотом?
  2. Вместо того, чтобы использовать GridSearchCV Для каждой модели есть ли метод, который я могу использовать, чтобы выбрать лучшую модель для моего набора данных? Я думаю, что это в рамках концепции выбора модели, но я не знаю, как использовать его через sklearn,

Спасибо

1 ответ

Использует ли GridSearchCV концепцию оценки максимального правдоподобия (MLE) под капотом?

MLE является вероятностным рассуждением, поэтому его можно применять только к вероятностным моделям. GridSearchCV не основан на MLE, это простой способ выбора модели на основе прямой оценки ошибки теста. Для конкретной модели ей может быть назначено число, представляющее, насколько она хороша - для многих моделей вы можете просто выбрать тот, у которого наибольшее число (самая высокая предполагаемая сила обобщения).

Вместо использования GridSearchCV для каждой модели, есть ли метод, который я могу использовать, чтобы выбрать лучшую модель для моего набора данных? Я думаю, что это в соответствии с концепцией выбора модели, но я не знаю, как использовать его через sklearn.

Их много, но в Sklearn реализованы только различные сплиттеры для тестирования поездов (CV, рандом и т. Д.); вместо этого вы можете рассмотреть другие библиотеки, которые поддерживают:

  • Байесовская оптимизация
  • Техника оценки дерева Парзена

Какие более продвинутые методы поиска хороших гиперпараметров (а не просто проверка уже существующих).

Другие вопросы по тегам