Поддерживает ли catboost однократное кодирование?

У меня есть ярлыки с горячим кодированием. Я хотел бы использовать их для обучения и прогнозирования с помощью классификатора catboost. Тем не менее, это дает мне ошибку, когда я подгоняю, говоря, что множественные целочисленные значения не допускаются в строке для меток. Так что же, catboost не позволяет использовать горячее кодирование для ярлыков? Если нет, как я могу заставить работать catboost?

1 ответ

Catboost выполняет внутреннее кодирование факторов автоматически, нет необходимости делать это вручную

Я нашел решение этой проблемы. Возможно, есть лучшее решение этой проблемы, о котором я хотел бы услышать.

Обходной путь должен преобразовать однократное кодирование в категориальные значения. Конечно, большую часть времени мы берем наши категориальные значения и конвертируем их в одноразовое кодирование. Так что просто не делайте этот шаг.

Затем установите функцию потерь в "MultiClass". Это единственная функция потерь, которую catboost (и я думаю, что большинство пакетов повышения градиента) будет поддерживать мультиклассификацию.

Другие вопросы по тегам