Как я могу найти кумулятивный счет в группе, используя Alibaba PyODPS?

Давайте рассмотрим, что у меня есть фрейм данных с именем Iris, в котором в качестве столбцов указаны имя, длина по длине, ширина по ширине, ширина по петле и длина по петле. Я хочу найти совокупный подсчет длины в группе.

Мой код:

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)

Но это показывает неправильный результат, чего мне не хватает?

1 ответ

Решение

Использование cumcount вместо countпредыдущий предназначен для оконной функции, а последний - для агрегации.

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)
Другие вопросы по тегам