Описание тега imblearn

Пакет обучения Python Imbalanced. Чтобы улучшить результаты или скорость процесса обучения в алгоритмах машинного обучения на наборах данных, где один или несколько классов имеют значительно меньше / больше обучающих примеров, вы можете использовать несбалансированный подход к обучению. В методах несбалансированного обучения используются методы повторной выборки, такие как SMOTE, ADASYN, ссылки Tomek, а также их различные комбинации.
0 ответов

sklearn: удалить класс большинства наугад, не тасуя набор данных

У меня есть набор данных изображения 48000, где 40k - нормальный класс и 8k - ненормальные экземпляры. Для того, чтобы сбалансировать набор данных, мне нужно провести выборку из класса большинства. Хотя я использовал метод случайной недостаточной вы…
21 фев '19 в 07:24
4 ответа

Как использовать SMOTENC внутри конвейера (ошибка: некоторые из категориальных индексов находятся вне диапазона)?

Буду очень признателен, если вы дадите мне знать, как использовать SMOTENC. Я написал: # Data XX = pd.read_csv('Financial Distress.csv') y = np.array(XX['Financial Distress'].values.tolist()) y = np.array([0 if i > -0.50 else 1 for i in y]) Na = …
0 ответов

Отрицательные размеры не допускаются (Smoteenn)

Я использую данные дисбаланса (2 классификация положительная: отрицательная = 9:1) поэтому я пытаюсь использовать SMOTEENN и optuna (optuna: чтобы найти соответствующее значение sampling_strategy) но я получил эту ошибку: Setting trial status as Tri…
29 янв '19 в 08:47
1 ответ

Как я могу генерировать категорические синтетические образцы с imblearn и SMOTE?

Я ищу для создания синтетических образцов для алгоритма машинного обучения, используя SMOTE imblearn. У меня есть несколько категорических функций, которые я преобразовал в целые числа, используя предварительную обработку sklearn.LabelEncoder. У мен…
14 ноя '16 в 01:18
6 ответов

При инициализации SMOTE ожидаются n_neighbors <= n_samples, но n_samples <n_neighbors

Я уже предварительно очистил данные, и ниже показан формат верхних 4 строк: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... 1 1909 ask secretari state war whether issu statement... 2 1909 i beg present peti…
14 ответов

Jupyter: ни один модуль с именем 'imblearn"после установки

Я установил "imbalanced-learn" (версия 0.3.1) на ANACONDA Navigator. Когда я запустил пример с сайта imbalanced-learn с использованием Jupyter (Python 3), я получил сообщение о "ModuleNotFoundError". Нет модуля с именем "imblearn". from imblearn.dat…
02 дек '17 в 10:25
2 ответа

Важность функции с использованием библиотеки Imbalanced-learn

Библиотека imblearn - это библиотека, используемая для несбалансированных классификаций. Это позволяет использовать scikit-learn оценки при балансировке классов с использованием различных методов, от недостаточной выборки до избыточной выборки до ан…
1 ответ

Имя RandomUnderSampler не определено

Я пытаюсь использовать RandomUnderSampler, Я правильно установил imblearn модуль. Но все равно получаю ошибку: "Имя" RandomUnderSampler "не определено". Есть какая-то конкретная причина для этого? Может кто-нибудь, пожалуйста, помогите from imblearn…
18 фев '19 в 07:11
0 ответов

Как сделать стратифицированную понижающую дискретизацию в питоне

Я имею дело с сильно несбалансированными данными (первый класс = 8% второго класса). Я предпочитаю занижать выборку класса большинства, но хочу сохранить его статистические свойства. к сожалению, методы понижающей дискретизации, которые я нашел, слу…
0 ответов

python imblearn make_pipeline TypeError: На последнем шаге Pipeline должна быть реализована подгонка

Я пытаюсь реализовать SMOTE imblearn внутри конвейера. Мои наборы данных - это текстовые данные, хранящиеся в панде. Пожалуйста, смотрите ниже фрагмент кода text_clf =Pipeline([('vect', TfidfVectorizer()),('scale', StandardScaler(with_mean=False)),(…
02 ноя '18 в 07:55
13 ответов

ModuleNotFoundError: нет модуля с именем 'imblearn'

Я попытался запустить следующий код: from imblearn import under_sampling, over_sampling from imblearn.over_sampling import SMOTE sm = SMOTE(random_state=12, ratio = 1.0) x_SMOTE, y_SMOTE = sm.fit_sample(X, y) что дает мне сообщение об ошибке: Module…
16 май '18 в 17:36
4 ответа

Блокнот Jupyter: импорт SMOTE из imblearn - ImportError: невозможно импортировать имя "pairwise_distances_chunked"

Я пытаюсь использовать SMOTE пакет в imblearn библиотека с использованием: from imblearn.over_sampling import SMOTE получить следующее сообщение об ошибке: ImportError: невозможно импортировать имя "pairwise_distances_chunked". Вот скриншот моего ск…
18 окт '18 в 19:26
8 ответов

Проблемы при импорте пакета imblearn python на ноутбук ipython

Я установил https://github.com/glemaitre/imbalanced-learn на Windows PowerShell, используя pip install, conda а также github, Но когда я на ноутбуке iPython, и я попытался импортировать пакет, используя: from unbalanced_dataset import UnderSampler, …
1 ответ

Невозможно импортировать из imblearn.over_sampling импорт SMOTE

Я установил imblearn используя pip install -U imbalanced-learn #version: conda version : 4.4.10 conda-build version : 3.4.1 python version : 3.6.4.final.0 Я продолжаю получать сообщения об ошибках, связанные с numpy и scipy, такие как модуль "numpy.…
14 фев '19 в 12:30
1 ответ

Как использовать Random Undersampler с ratio = 'dict' в imblearn?

Я пытаюсь справиться с несбалансированным набором данных, используя случайный недосэмплер imblearn. Я хочу указать количество меток для выборки вручную. Вот мой код: sm = RandomUnderSampler(ratio = {0:142498, 1: 495}, random_state=42) X_train, y_tra…
23 июн '17 в 15:18
1 ответ

Почему imblearn работает с ноутбуком Jupyter Python 2, а не 3?

Я пытаюсь запустить код, но я получаю ошибку. Если у меня есть ядро ​​на Python 2, то imblearn работает гладко, но pipe_grid не работает. Когда я переключаюсь на Python 3, pipe_grid работает, но imblearn перестает работать. Я не поделился кодом, пот…
1 ответ

Ошибка при импорте imblearn.undersampling

Я получаю сообщение об ошибке "нет имени модуля sklearn.cluster" при импорте модуля imblearn_undersampling. Я не получаю сообщение об ошибке при импорте SMOTE из imblearn, как показано на рисунке. Некоторые из решений, которые я попробовал: -Устано…
0 ответов

TomekLinks fit_sample(X,y) занимает много времени

Я работаю над проблемой классификации текста. Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова метода fit_sample(X,y) программы класса TomekLinks ничего не происходит, даже если я жду 30 минут. Мой набо…
08 май '19 в 14:43
1 ответ

imblearn smote+enn в выборочном классе большинства

У меня несбалансированный набор данных, и когда я пытаюсь сбалансировать его с помощью SMOTEENN, число классов большинства уменьшается вдвое Я пытался изменить параметр "sampling_strategy" со всеми предоставленными опциями, но это не помогло from im…
1 ответ

Как повысить точность, не снижая количество повторных вызовов в несбалансированном наборе данных?

Я должен использовать дерево решений для двоичной классификации по несбалансированному набору данных (50000:0, 1000:1). Чтобы получить хороший результат (0,92), я использовал функцию RandomOversampling, найденную в модуле Imblearn, и обрезку с парам…