Оценка достоверности мультиклассовой классификации с использованием мультиклассовой классификации с использованием pred_proba SGDclassifier
Я использую логистическую регрессию в SGDClassifier для выполнения мультиклассовой классификации категории ~10 тыс. Чтобы получить оценку достоверности предсказанного результата, я использую функцию pred_proba. Но я получаю значение вероятности предсказания 0,00026091,0,00049697,0,00019632 как для правильного, так и для неправильного прогноза.
Пожалуйста, предложите способ нормализации оценки, чтобы я мог рассмотреть результат, отфильтровав значение вероятности
1 ответ
Если значения вероятности для всех классов очень низкие, это может означать, что вашему классификатору трудно классифицировать образцы. Возможно, вы захотите поработать над некоторыми функциями или попробовать другую модель. Чтобы нормализовать значения, взгляните на Scikit-learn MinMaxScaler. Это приведет к масштабированию данных до чисел от 0 до 1. Но, как я уже сказал, если вероятность для всех значений очень мала, вы не получите хорошего результата классификации. надеюсь, это поможет