Хорошее MSE не означает хороший прогноз в логистической регрессии?
Я пишу код для упорядоченной логистической регрессии. Я наблюдаю это интересное явление и задаюсь вопросом, нормально ли это или просто мой код неверен.
Для функции потерь я использую функцию логистических потерь (максимизирую вероятность двоичных переменных). Чтобы сделать прогноз, прогнозируемые вероятности получены для новых наблюдений, и AUC используется для поиска наилучшего порогового значения.
Самое смешное, что я часто сталкиваюсь со случаями, когда оценочный параметр имеет гораздо лучшее значение MSE (отклонение), чем другой параметр в новых наблюдениях, но прогноз хуже (намного хуже). Поэтому мне кажется, что среднеквадратическая ошибка может не иметь ничего общего с эффективностью прогнозирования (как в случае с линейной регрессией). Кто-нибудь видел то же самое?