Как я могу найти кумулятивный счет в группе, используя Alibaba PyODPS?
Давайте рассмотрим, что у меня есть фрейм данных с именем Iris, в котором в качестве столбцов указаны имя, длина по длине, ширина по ширине, ширина по петле и длина по петле. Я хочу найти совокупный подсчет длины в группе.
Мой код:
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)
Но это показывает неправильный результат, чего мне не хватает?
1 ответ
Решение
Использование cumcount
вместо count
предыдущий предназначен для оконной функции, а последний - для агрегации.
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)