Тест One-Hot-Encode для соответствия Train с другой категорией
У меня есть категорическая функция, которую я хотел бы кодировать в горячем режиме, но тестовые данные (не доступны) могут включать дополнительные категории, и я не могу переобучить или настроить модель после получения тестовых данных.
Моя идея состояла бы в том, чтобы создать "горячие" столбцы для категорий в данных обучения, а затем разделить данные теста либо на эти категории, либо на категорию "Другие".
Проблема в том, что я не знаю, как этого добиться pandas.get_dummies
или же sklearn.preprocessing.OneHotEncoder
,