Описание тега imblearn
Пакет обучения Python Imbalanced. Чтобы улучшить результаты или скорость процесса обучения в алгоритмах машинного обучения на наборах данных, где один или несколько классов имеют значительно меньше / больше обучающих примеров, вы можете использовать несбалансированный подход к обучению. В методах несбалансированного обучения используются методы повторной выборки, такие как SMOTE, ADASYN, ссылки Tomek, а также их различные комбинации.
0
ответов
sklearn: удалить класс большинства наугад, не тасуя набор данных
У меня есть набор данных изображения 48000, где 40k - нормальный класс и 8k - ненормальные экземпляры. Для того, чтобы сбалансировать набор данных, мне нужно провести выборку из класса большинства. Хотя я использовал метод случайной недостаточной вы…
21 фев '19 в 07:24
4
ответа
Как использовать SMOTENC внутри конвейера (ошибка: некоторые из категориальных индексов находятся вне диапазона)?
Буду очень признателен, если вы дадите мне знать, как использовать SMOTENC. Я написал: # Data XX = pd.read_csv('Financial Distress.csv') y = np.array(XX['Financial Distress'].values.tolist()) y = np.array([0 if i > -0.50 else 1 for i in y]) Na = …
24 янв '19 в 08:47
0
ответов
Отрицательные размеры не допускаются (Smoteenn)
Я использую данные дисбаланса (2 классификация положительная: отрицательная = 9:1) поэтому я пытаюсь использовать SMOTEENN и optuna (optuna: чтобы найти соответствующее значение sampling_strategy) но я получил эту ошибку: Setting trial status as Tri…
29 янв '19 в 08:47
1
ответ
Как я могу генерировать категорические синтетические образцы с imblearn и SMOTE?
Я ищу для создания синтетических образцов для алгоритма машинного обучения, используя SMOTE imblearn. У меня есть несколько категорических функций, которые я преобразовал в целые числа, используя предварительную обработку sklearn.LabelEncoder. У мен…
14 ноя '16 в 01:18
6
ответов
При инициализации SMOTE ожидаются n_neighbors <= n_samples, но n_samples <n_neighbors
Я уже предварительно очистил данные, и ниже показан формат верхних 4 строк: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... 1 1909 ask secretari state war whether issu statement... 2 1909 i beg present peti…
20 мар '18 в 23:48
14
ответов
Jupyter: ни один модуль с именем 'imblearn"после установки
Я установил "imbalanced-learn" (версия 0.3.1) на ANACONDA Navigator. Когда я запустил пример с сайта imbalanced-learn с использованием Jupyter (Python 3), я получил сообщение о "ModuleNotFoundError". Нет модуля с именем "imblearn". from imblearn.dat…
02 дек '17 в 10:25
2
ответа
Важность функции с использованием библиотеки Imbalanced-learn
Библиотека imblearn - это библиотека, используемая для несбалансированных классификаций. Это позволяет использовать scikit-learn оценки при балансировке классов с использованием различных методов, от недостаточной выборки до избыточной выборки до ан…
18 сен '17 в 16:25
1
ответ
Имя RandomUnderSampler не определено
Я пытаюсь использовать RandomUnderSampler, Я правильно установил imblearn модуль. Но все равно получаю ошибку: "Имя" RandomUnderSampler "не определено". Есть какая-то конкретная причина для этого? Может кто-нибудь, пожалуйста, помогите from imblearn…
18 фев '19 в 07:11
0
ответов
Как сделать стратифицированную понижающую дискретизацию в питоне
Я имею дело с сильно несбалансированными данными (первый класс = 8% второго класса). Я предпочитаю занижать выборку класса большинства, но хочу сохранить его статистические свойства. к сожалению, методы понижающей дискретизации, которые я нашел, слу…
26 фев '19 в 17:17
0
ответов
python imblearn make_pipeline TypeError: На последнем шаге Pipeline должна быть реализована подгонка
Я пытаюсь реализовать SMOTE imblearn внутри конвейера. Мои наборы данных - это текстовые данные, хранящиеся в панде. Пожалуйста, смотрите ниже фрагмент кода text_clf =Pipeline([('vect', TfidfVectorizer()),('scale', StandardScaler(with_mean=False)),(…
02 ноя '18 в 07:55
13
ответов
ModuleNotFoundError: нет модуля с именем 'imblearn'
Я попытался запустить следующий код: from imblearn import under_sampling, over_sampling from imblearn.over_sampling import SMOTE sm = SMOTE(random_state=12, ratio = 1.0) x_SMOTE, y_SMOTE = sm.fit_sample(X, y) что дает мне сообщение об ошибке: Module…
16 май '18 в 17:36
4
ответа
Блокнот Jupyter: импорт SMOTE из imblearn - ImportError: невозможно импортировать имя "pairwise_distances_chunked"
Я пытаюсь использовать SMOTE пакет в imblearn библиотека с использованием: from imblearn.over_sampling import SMOTE получить следующее сообщение об ошибке: ImportError: невозможно импортировать имя "pairwise_distances_chunked". Вот скриншот моего ск…
18 окт '18 в 19:26
8
ответов
Проблемы при импорте пакета imblearn python на ноутбук ipython
Я установил https://github.com/glemaitre/imbalanced-learn на Windows PowerShell, используя pip install, conda а также github, Но когда я на ноутбуке iPython, и я попытался импортировать пакет, используя: from unbalanced_dataset import UnderSampler, …
12 окт '16 в 20:42
1
ответ
Невозможно импортировать из imblearn.over_sampling импорт SMOTE
Я установил imblearn используя pip install -U imbalanced-learn #version: conda version : 4.4.10 conda-build version : 3.4.1 python version : 3.6.4.final.0 Я продолжаю получать сообщения об ошибках, связанные с numpy и scipy, такие как модуль "numpy.…
14 фев '19 в 12:30
1
ответ
Как использовать Random Undersampler с ratio = 'dict' в imblearn?
Я пытаюсь справиться с несбалансированным набором данных, используя случайный недосэмплер imblearn. Я хочу указать количество меток для выборки вручную. Вот мой код: sm = RandomUnderSampler(ratio = {0:142498, 1: 495}, random_state=42) X_train, y_tra…
23 июн '17 в 15:18
1
ответ
Почему imblearn работает с ноутбуком Jupyter Python 2, а не 3?
Я пытаюсь запустить код, но я получаю ошибку. Если у меня есть ядро на Python 2, то imblearn работает гладко, но pipe_grid не работает. Когда я переключаюсь на Python 3, pipe_grid работает, но imblearn перестает работать. Я не поделился кодом, пот…
22 фев '19 в 00:23
1
ответ
Ошибка при импорте imblearn.undersampling
Я получаю сообщение об ошибке "нет имени модуля sklearn.cluster" при импорте модуля imblearn_undersampling. Я не получаю сообщение об ошибке при импорте SMOTE из imblearn, как показано на рисунке. Некоторые из решений, которые я попробовал: -Устано…
07 янв '19 в 02:46
0
ответов
TomekLinks fit_sample(X,y) занимает много времени
Я работаю над проблемой классификации текста. Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова метода fit_sample(X,y) программы класса TomekLinks ничего не происходит, даже если я жду 30 минут. Мой набо…
08 май '19 в 14:43
1
ответ
imblearn smote+enn в выборочном классе большинства
У меня несбалансированный набор данных, и когда я пытаюсь сбалансировать его с помощью SMOTEENN, число классов большинства уменьшается вдвое Я пытался изменить параметр "sampling_strategy" со всеми предоставленными опциями, но это не помогло from im…
01 апр '19 в 19:20
1
ответ
Как повысить точность, не снижая количество повторных вызовов в несбалансированном наборе данных?
Я должен использовать дерево решений для двоичной классификации по несбалансированному набору данных (50000:0, 1000:1). Чтобы получить хороший результат (0,92), я использовал функцию RandomOversampling, найденную в модуле Imblearn, и обрезку с парам…
27 мар '19 в 16:11