Дискретизация непрерывных атрибутов с помощью np.histogram - как применить к новой точке данных?

Продолжение Как сделать дискретизацию непрерывных атрибутов в склеарне?

После того, как я "выучил" свои бункеры по данным поезда, используя np.histogram(A['my_var']) как мне применить его на моем тестовом наборе? в каком бине находится атрибут my_var каждой точки данных? И мои данные о поездах и тестах находятся в кадрах данных панд, если это имеет значение.

Спасибо

1 ответ

Упс. это просто.

hist = np.histogram(A['my_var'])
A.loc[:, 'my_bin'] = np.digitize(A['my_var'], hist[1])
Другие вопросы по тегам