Описание тега imblearn
imbalanced-learn
- это пакет Python, предлагающий ряд методов повторной выборки, обычно используемых в наборах данных, демонстрирующих сильный межклассовый дисбаланс. Он совместим сscikit-learn
и является частью scikit-learn-contrib
проекты.
Большинство алгоритмов классификации будут работать оптимально только тогда, когда количество образцов каждого класса примерно одинаково. Наборы данных с сильным перекосом, в которых меньшинство значительно превосходит численностью одного или нескольких классов, оказались проблемой, но в то же время становятся все более и более распространенными.
Один из способов решения этой проблемы - повторная выборка набора данных, чтобы компенсировать этот дисбаланс в надежде прийти к более надежной и справедливой границе принятия решений, чем вы могли бы в противном случае.
Методы повторной выборки делятся на две категории:
Under-sampling the majority class(es).
Over-sampling the minority class.
Combining over- and under-sampling.
Create ensemble balanced sets.
Ниже приведен список методов, реализованных в настоящее время в этом модуле.
Недостаточная выборка
- Недостаточная выборка случайным большинством с заменой
- Извлечение ссылок Томек большинства-меньшинства
- Недостаточная выборка с кластерными центроидами
- NearMiss-(1, 2 и 3)
- Сжатый ближайший сосед
- Односторонний выбор
- Правило уборки в районе
- Отредактировано ближайших соседей
- Порог жесткости экземпляра
- Повторно отредактированные ближайшие соседи
- AllKNN
Чрезмерные выборки12. Случайного меньшинства передискретизации с заменой 13. поражал - Синтетический Minority передискретизации Техника 14. bSMOTE(1 & 2) - Пограничный поражал типов 1 и 2 15. SVM поражал - Поддержка векторы поражали 16. ADASYN - Подход адаптивной синтетической выборки для несбалансированного обучения
Избыточная выборка с последующей недостаточной выборкой
- SMOTE + Tomek ссылки
- SMOTE + ENN
Классификатор ансамбля, использующий внутренние сэмплеры
- EasyEnsemble
- Баланс Каскад
- Сбалансированный случайный лес
- Сбалансированная упаковка