Как мне выполнить суммирование `n` строк за раз в пандах?

Question

Учитывая фрейм данных

Этот фрейм данных имеет 20 столбцов. Я бы хотел группу n=5 строки и суммировать их. Итак, мой вывод будет выглядеть так:

df.rolling_sum не поможет, потому что не позволяет варьировать шаг при суммировании.

Какие еще есть способы сделать это?

python pandas pandas-groupby

Источник

user4909087 05 авг '17 в 19:17

3 ответа

Решение

Предполагая, что ваши индексы смежны, вы можете выполнить целочисленное деление на df.index, а затем сгруппировать по индексу.

Для df выше, вы можете сделать это:

In [447]: df.index // 5
Out[447]: Int64Index([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3], dtype='int64')

Получить окончательный ответ - еще один шаг, используя df.groupby а также dfGroupBy.sum:

In [448]: df.groupby(df.index // 5).sum()
Out[448]: 
     A
0  250
1  347
2  266
3  328

Если у вас нет RangeIndex использовать df.reset_index сначала и потом группа.

Источник

user4909087 05 авг '17 в 19:17

Если вы можете управлять ndarray суммами, а не сериями (вы всегда можете построить серию заново), вы можете использовать np.add.reduceat,

np.add.reduceat(df.A.values, np.arange(0, df.A.size, 5))

Который в этом случае возвращает

array([250, 347, 266, 328])

Источник

user4686625 05 авг '17 в 19:21

Другие вопросы по тегам python pandas pandas-groupby

user2336654 05 авг '17 в 19:19 2017-08-05 19:19 · Accepted Answer · 2017-08-05 19:19

df.set_index(df.index // 5).sum(level=0)

Источник

user2336654 05 авг '17 в 19:19