Как преобразовать в бин отфильтрованные данные панд?

Question

Как преобразовать в бин отфильтрованные данные панд?

Все,

Заголовок моего набора данных выглядит следующим образом. Я отфильтровал столбцы "Возраст" и "Время прогулов в часах" и рассчитал среднее значение часов. Теперь я хотел бы, чтобы бен на основе столбца возраста. Как я могу это сделать? Я хотел бы бин Возраст Возраст 31-33, Возраст 34-36, Возраст 37-39

{'Age': {0: 33, 2: 38, 3: 39, 4: 33, 5: 38}, 'BMI': {0: 30, 2: 31, 3: 24, 4: 30, 5: 31}, 'Social_drinker': {0: 1, 2: 1, 3: 1, 4: 1, 5: 1}, 'Social_smoker': {0: 0, 2: 0, 3: 1, 4: 0, 5: 0}, 'Son': {0: 2, 2: 0, 3: 2, 4: 2, 5: 0}, 'Day_of_the_week': {0: 3, 2: 4, 3: 5, 4: 5, 5: 6}, 'Month_of_absence': {0: 7, 2: 7, 3: 7, 4: 7, 5: 7}, 'Seasons': {0: 1, 2: 1, 3: 1, 4: 1, 5: 1}, 'Service_time': {0: 13, 2: 18, 3: 14, 4: 13, 5: 18}, 'Absenteeism_time_in_hours': {0: 4, 2: 2, 3: 4, 4: 2, 5: 2}}

Мой код для фильтрации:

filter= df.filter(['Age','Absenteeism_time_in_hours'], axis=1) 
group=filter.groupby('Age').mean()[['Absenteeism_time_in_hours']]

Я новичок в Python, если вы можете дать объяснение, которое будет здорово!

0

python pandas pandas-groupby

Источник

user3971643 02 дек '18 в 03:26

1 ответ

Решение

Другие вопросы по тегам python pandas pandas-groupby

user1648033 02 дек '18 в 03:37 2018-12-02 03:37 · Accepted Answer · 2018-12-02 03:37

Вы ищете функцию cut, Он может быть использован для ваших данных следующим образом:

group.groupby(pd.cut(group.index, [31, 33, 36, 39])).mean().fillna(0)

Что приводит к

          Absenteeism_time_in_hours
(31, 33]                          3
(33, 36]                          0
(36, 39]                          3

Как видите, вы указываете края бункеров, а остальное он обрабатывает за вас.

Тем не менее, я настоятельно рекомендую не группировать результаты, так как вы получите неправильный ответ. Вам лучше работать с исходными данными, чтобы вы могли правильно рассчитать среднее число людей в каждой группе бинов.

Обратите внимание на разницу в последней возрастной группе, когда вы делаете

(df.groupby(pd.cut(df.Age, [31, 33, 36, 39]))
 .Absenteeism_time_in_hours.mean().fillna(0))

Результат:

Age
(31, 33]    3.000000
(33, 36]    0.000000
(36, 39]    2.666667