Сгруппируйте повторяющиеся столбцы и суммируйте значения соответствующих столбцов с помощью панд
Я предварительно обрабатываю данные журнала сервера Apache. У меня есть 3 столбца ID, ВРЕМЯ и БАЙТЫ. Пример:
ID ВРЕМЯ БАЙТОВ
1 13:00 10
2 13:02 30
3 13:03 40
4 13:02 50
5 13:03 70
Я хочу добиться чего-то вроде этого:
ID ВРЕМЯ БАЙТОВ
1 13:00 10
2 13:02 80
3 13:03 110
1 ответ
Решение
Давай попробуем:
df['TIME'] = pd.to_datetime(df['TIME'])
ax = df.groupby('TIME')['BYTES'].sum().plot()
ax.set_xlim('13:00:00','13:03:00')
Выход: