Определение метки в матрице смешения с сильно несбалансированным набором данных
В настоящее время я работаю над созданием модели нейронной сети, которая предназначена для прогнозирования успеха / сбоя обновления сервера.
Однако существующие данные сильно несбалансированы. Т.е. только 3 % записей являются сбоями, остальное - все записи успеха.
Я сейчас пытаюсь сделать некоторые исследования данных с использованием путаницы. В этом случае я должен назначить метку "Positive(1)" метке "Fail"? или даже имеет значение, какой ярлык я назначаю?
Спасибо заранее.
1 ответ
Это проблема двоичной классификации. Обычно классы помечены как положительные =1, а отрицательные =0