Передискретизация не генерирует новые образцы
Мой набор данных имеет следующее распределение:
class frequency
0 960
1 2093
2 22696
3 1116
4 2541
5 1298
6 14
я использую python-imblearn
пересмотреть класс меньшинства. С regular
Я могу генерировать 200 образцов класса 6, но с l1borderline
или же l2borderline
Я не в состоянии сделать это.
from imblearn.over_sampling import SMOTE
sm=SMOTE(ratio={6:200})
# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 200})
sm=SMOTE(kind='borderline1',ratio={6:200})
# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
sm=SMOTE(kind='borderline2',ratio={6:200})
# output
>>> Presampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
>>> resampled shape Counter({2: 22696, 4: 2541, 1: 2093, 5: 1298, 3: 1116, 0: 960, 6: 14})
Есть что-то математическое или я что-то упустил?