Дискретизация непрерывных атрибутов с помощью np.histogram - как применить к новой точке данных?
Продолжение Как сделать дискретизацию непрерывных атрибутов в склеарне?
После того, как я "выучил" свои бункеры по данным поезда, используя np.histogram(A['my_var'])
как мне применить его на моем тестовом наборе? в каком бине находится атрибут my_var каждой точки данных? И мои данные о поездах и тестах находятся в кадрах данных панд, если это имеет значение.
Спасибо
1 ответ
Упс. это просто.
hist = np.histogram(A['my_var'])
A.loc[:, 'my_bin'] = np.digitize(A['my_var'], hist[1])