sklearn: удалить класс большинства наугад, не тасуя набор данных

У меня есть набор данных изображения 48000, где 40k - нормальный класс и 8k - ненормальные экземпляры. Для того, чтобы сбалансировать набор данных, мне нужно провести выборку из класса большинства. Хотя я использовал метод случайной недостаточной выборки sklearn imblearn, который прекрасно работает, но мне нужно сохранить порядок строк (последовательность изображений) при удалении большинства экземпляров.

0 ответов

Другие вопросы по тегам