TomekLinks fit_sample(X,y) занимает много времени

Я работаю над проблемой классификации текста. Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова метода fit_sample(X,y) программы класса TomekLinks ничего не происходит, даже если я жду 30 минут. Мой набор данных длиной 1800000 записей (текстовые данные). Вот фрагмент кода

из imblearn.under_sampling import TomekLinks

tl = TomekLinks (return_indices = True, коэффициент = "большинство",random_state=42) X_tl, y_tl = tl.sample(train_x,y_binary)

Может кто-нибудь помочь, почему это занимает так много времени?

Также, когда я делаю tl.fit() отдельно, он завершается в течение нескольких секунд, но когда я вызываю метод tl.sample(), возникает ошибка, что в TomekLinks нет атрибута с именем sample

0 ответов

Другие вопросы по тегам