Как получить доверительный интервал или показатель дисперсии прогноза при использовании xgboost для классификации?

Как получить доверительный интервал или показатель дисперсии прогноза при использовании xgboost для классификации?

Так, например, если xgboost прогнозирует вероятность события 0,9, как можно получить уверенность в этой вероятности?

Также эта уверенность считается гетероскедастичной?

1 ответ

Решение

Чтобы получить доверительные интервалы для модели xgboost, вы должны обучить несколько моделей (вы можете использовать для этого мешки). Каждая модель будет давать ответ для тестовой выборки - все ответы будут формировать распределение, из которого вы можете легко вычислить доверительные интервалы, используя базовую статистику. Вы должны произвести распределение ответов для каждого тестового образца.

Другие вопросы по тегам