TomekLinks fit_sample(X,y) занимает много времени
Я работаю над проблемой классификации текста. Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова метода fit_sample(X,y) программы класса TomekLinks ничего не происходит, даже если я жду 30 минут. Мой набор данных длиной 1800000 записей (текстовые данные). Вот фрагмент кода
из imblearn.under_sampling import TomekLinks
tl = TomekLinks (return_indices = True, коэффициент = "большинство",random_state=42) X_tl, y_tl = tl.sample(train_x,y_binary)
Может кто-нибудь помочь, почему это занимает так много времени?
Также, когда я делаю tl.fit() отдельно, он завершается в течение нескольких секунд, но когда я вызываю метод tl.sample(), возникает ошибка, что в TomekLinks нет атрибута с именем sample