Хорошая кривая ROC, но плохая кривая точности-отзыва

Question

Хорошая кривая ROC, но плохая кривая точности-отзыва

У меня есть некоторые результаты машинного обучения, которые я не совсем понимаю. Я использую Python Sciki-Learn, с более чем 2 миллионами данных о 14 функциях. Классификация "ab" выглядит довольно плохо на кривой точного отзыва, но ROC для Ab выглядит так же хорошо, как и классификация большинства других групп. Чем это можно объяснить?

12

machine-learning scikit-learn performance-testing roc precision-recall

Источник

user3635544 23 окт '15 в 03:49

1 ответ

Решение

Другие вопросы по тегам machine-learning scikit-learn performance-testing roc precision-recall

user333599 23 окт '15 в 07:40 2015-10-23 07:40 · Accepted Answer · 2015-10-23 07:40

Классовый дисбаланс.

В отличие от кривой ROC, кривые PR очень чувствительны к дисбалансу. Если вы оптимизируете свой классификатор для хорошего AUC на несбалансированных данных, вы, вероятно, получите плохие результаты повторного вызова.

18

Источник

user333599 23 окт '15 в 07:40