Тест One-Hot-Encode для соответствия Train с другой категорией

У меня есть категорическая функция, которую я хотел бы кодировать в горячем режиме, но тестовые данные (не доступны) могут включать дополнительные категории, и я не могу переобучить или настроить модель после получения тестовых данных.

Моя идея состояла бы в том, чтобы создать "горячие" столбцы для категорий в данных обучения, а затем разделить данные теста либо на эти категории, либо на категорию "Другие".

Проблема в том, что я не знаю, как этого добиться pandas.get_dummies или же sklearn.preprocessing.OneHotEncoder,

0 ответов

Другие вопросы по тегам