StratifiedShuffleSplit со многими классами и небольшим размером теста

У меня есть набор данных размером ~7000 с 2000+ различных классов. С помощью StratifiedShuffleSplit с test_size=0.2 Я получаю ошибку:

ValueError: The test_size = 1364 should be greater or equal to the number of classes = 2030  

Очевидно, что балансировка классов в тестовом наборе невозможна, но меня больше всего интересует баланс в наборе поездов. Есть ли способ для меня, чтобы использовать StratifiedShuffleSplit с такими данными?

0 ответов

Другие вопросы по тегам