Как найти и добавить столбец частоты для идентификатора?
Я новичок в питоне, так что терпите меня!
Мой набор данных от Excel, и мне было интересно, как найти и добавить столбец частоты для моего идентификатора.
Сначала я выполнил функцию группировки для идентификатора и даты, выполнив:
dfcount = dfxyz.groupby(["ID", "Date"])
а затем нашел среднее значение, выполнив:
dfcount1 = dfcount.mean()
Вывод, который я получил, был:
То, что я пытаюсь сделать, это получить номер частоты рядом с ним, как это:
Я не знал, как скопировать код Python, поэтому я загрузил картинки! Сожалею! Мы ценим любую помощь в том, какой код я могу использовать для подсчета частоты для каждого идентификатора ПОСЛЕ того, как я найду среднее значение для столбцов группировки.
Заранее спасибо!
2 ответа
Вы можете использовать groupby
с cumcount
df['Freq']=(df.groupby(level=0).cumcount()+1).values
Вы можете использовать это:
df['column_name'].value_counts()
value_counts - возвращает объект, содержащий количество уникальных значений.