Передискретизация не генерирует новые образцы

Мой набор данных имеет следующее распределение:

class   frequency
0         960
1         2093
2         22696
3         1116
4         2541
5         1298
6         14

я использую python-imblearn пересмотреть класс меньшинства. С regular Я могу генерировать 200 образцов класса 6, но с l1borderline или же l2borderline Я не в состоянии сделать это.

from imblearn.over_sampling import SMOTE
sm=SMOTE(ratio={6:200})

# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 200})



sm=SMOTE(kind='borderline1',ratio={6:200})

# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})

sm=SMOTE(kind='borderline2',ratio={6:200})

# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})

Есть что-то математическое или я что-то упустил?

0 ответов

Другие вопросы по тегам