dask: как группировать, агрегировать без потери столбца, используемого для группировки
Как получить сгруппированный вывод в стиле SQL при группировке следующих данных:
item frequency
A 5
A 9
B 2
B 4
C 6
df.groupby(by = ["item"]).sum()
Результаты в этом:
item frequency
A 14
B 6
C 6
В пандах это достигается установкой as_index=False
, Но Dask не поддерживает этот аргумент в групповом. В настоящее время он опускается item
столбец и возвращает серию с frequency
колонка.