Расчет баллов точности прогнозируемых непрерывных значений
Из sklearn.metrics импортировать precision_score
точность_счетная (y_true, y_pred)
Я верю, что этот код вернет точность наших прогнозов. Однако я сравниваю прогнозные и фактические значения непрерывных значений и считаю, что большинство из них не будут точно такими же.
Должен ли я соответствовать значениям набора тестов и построить прогнозные значения, чтобы получить R-квадрат?
Может кто-нибудь, пожалуйста, посоветуйте мне, как измерить точность прогнозов в случае непрерывных переменных?
1 ответ
В машинном обучении точность определяется для дискретных значений (классов). Его определяют как долю правильных прогнозов от общего количества сделанных прогнозов.
Таким образом, прогноз значения 319, где истинное значение равно 320, все еще является неправильным прогнозом.
Поэтому не рекомендуется рассчитывать точность для непрерывных значений. Для таких значений вы хотите вычислить меру того, насколько близки прогнозируемые значения к истинным значениям. Эта задача прогнозирования непрерывных значений известна как регрессия. И, как правило, значение R-квадрата используется для измерения производительности модели.
Ты можешь использовать r2_score(y_true, y_pred)
для вашего сценария.
Существуют различные метрики для задач регрессии (прогнозирование непрерывных переменных), такие как:-
- Средняя квадратическая ошибка,
- Средняя абсолютная ошибка,
- Оценка отклонений и т. Д.
Вы можете получить больше информации о реализации этих показателей в sklearn здесь.