Использование панд для получения совокупной суммы данных по дням
питон
У меня есть данные о погоде за 122 дня из Wunderground, которые не имеют равных интервалов выборки по времени. Вот образец моих данных:
Bangor Weather Data from Wunderground
Datetime,Temp(F),Precip(in.),Snow (in.),PET(in./day),Baro(mBar)
2015-12-02 01:30:00,1.1,0.3,0.0,0.45524647117649564,1017.5
2015-12-02 01:53:00,1.1,0.3,0.0,0.45524647117649564,1017.6
2015-12-02 02:20:00,1.1,0.3,0.0,0.45524647117649564,1017.2
2015-12-02 02:53:00,1.7,0.5,0.0,0.500024812603692,1016.7
2015-12-02 02:55:00,1.7,0.3,0.0,0.500024812603692,1016.5
2015-12-02 03:09:00,1.1,0.3,0.0,0.45524647117649564,1016.1
2015-12-02 03:33:00,1.1,0.5,0.0,0.45524647117649564,1016.1
2015-12-02 03:53:00,1.7,0.8,0.0,0.500024812603692,1016.1
2015-12-02 04:34:00,1.7,0.5,0.0,0.500024812603692,1015.1
2015-12-02 04:46:00,1.7,0.5,0.0,0.500024812603692,1015.1
2015-12-02 04:53:00,1.7,0.8,0.0,0.500024812603692,1015.1
2015-12-02 05:13:00,1.7,0.0,0.0,0.500024812603692,1014.4
Я хочу получить суточную сумму снега (сбросить на ноль для нового дня) для всего моего набора данных. Я хочу, чтобы мой вывод выглядел так:
2015-12-01,0.0
2015-12-02,0.0
2015-12-03,1.0
2015-12-04,3.0
2015-12-05,0.0
2015-12-06,1.0
Как я могу использовать панды, чтобы сделать это?
2 ответа
Это то, что вы хотите?
df.groupby(df.Datetime.dt.date)['Snow (in.)'].sum()
Это даст вам количество снега (сумма) в день
Вы также можете использовать:
df['Snow (in.)'].resample('D').sum()