StratifiedShuffleSplit со многими классами и небольшим размером теста
У меня есть набор данных размером ~7000 с 2000+ различных классов. С помощью StratifiedShuffleSplit
с test_size=0.2
Я получаю ошибку:
ValueError: The test_size = 1364 should be greater or equal to the number of classes = 2030
Очевидно, что балансировка классов в тестовом наборе невозможна, но меня больше всего интересует баланс в наборе поездов. Есть ли способ для меня, чтобы использовать StratifiedShuffleSplit
с такими данными?