Определение метки в матрице смешения с сильно несбалансированным набором данных

В настоящее время я работаю над созданием модели нейронной сети, которая предназначена для прогнозирования успеха / сбоя обновления сервера.

Однако существующие данные сильно несбалансированы. Т.е. только 3 % записей являются сбоями, остальное - все записи успеха.

Я сейчас пытаюсь сделать некоторые исследования данных с использованием путаницы. В этом случае я должен назначить метку "Positive(1)" метке "Fail"? или даже имеет значение, какой ярлык я назначаю?

Спасибо заранее.

1 ответ

Это проблема двоичной классификации. Обычно классы помечены как положительные =1, а отрицательные =0

Другие вопросы по тегам