Подсчет частот соответствующих значений в пандах [python 3]

Question

Подсчет частот соответствующих значений в пандах [python 3]

У меня есть набор данных со следующими значениями:

var1  var2 
1234  abc
2345  bcs
5678  csd
1234  abc
1234  bcs
5678  csd
1234  bcs
1234  xyz
1234  abc
9101  zzz

Мне нужно, чтобы каждое уникальное значение в столбце var1 подсчитывало и показывало верхние 3 значения частоты соответствующих значений в var2 и получало выходные данные, например:

var1  var2  count
1234  abc   3
1234  bcs   2
1234  xyz   1
5678  csd   2
9101  zzz   1

Какой самый эффективный способ сделать это?

2

python pandas count cumulative-frequency

Источник

user1907382 19 мар '17 в 20:11

3 ответа

Решение

df_a.groupby(['var1','var2'])['var2'].agg({'count':'count'}).reset_index()

1

Источник

user6361531 19 мар '17 в 20:30

Это сработало:

df.groupby(['var1','var2']).count()

0

Источник

user1907382 19 мар '17 в 20:49

Другие вопросы по тегам python pandas count cumulative-frequency

user2336654 20 мар '17 в 07:19 2017-03-20 07:19 · Accepted Answer · 2017-03-20 07:19

Вы должны включить nlargest

df.groupby('var1').var2.apply(lambda x: x.value_counts().nlargest(3)) \
    .reset_index(name='count').rename(columns={'level_1': 'var2'})

   var1 var2  count
0  1234  abc      3
1  1234  bcs      2
2  1234  xyz      1
3  2345  bcs      1
4  5678  csd      2
5  9101  zzz      1

2

Источник

user2336654 20 мар '17 в 07:19