Использование панд для получения совокупной суммы данных по дням

питон

У меня есть данные о погоде за 122 дня из Wunderground, которые не имеют равных интервалов выборки по времени. Вот образец моих данных:

Bangor Weather Data from Wunderground
Datetime,Temp(F),Precip(in.),Snow (in.),PET(in./day),Baro(mBar)
    2015-12-02 01:30:00,1.1,0.3,0.0,0.45524647117649564,1017.5 
    2015-12-02 01:53:00,1.1,0.3,0.0,0.45524647117649564,1017.6 
    2015-12-02 02:20:00,1.1,0.3,0.0,0.45524647117649564,1017.2 
    2015-12-02 02:53:00,1.7,0.5,0.0,0.500024812603692,1016.7 
    2015-12-02 02:55:00,1.7,0.3,0.0,0.500024812603692,1016.5 
    2015-12-02 03:09:00,1.1,0.3,0.0,0.45524647117649564,1016.1 
    2015-12-02 03:33:00,1.1,0.5,0.0,0.45524647117649564,1016.1 
    2015-12-02 03:53:00,1.7,0.8,0.0,0.500024812603692,1016.1 
    2015-12-02 04:34:00,1.7,0.5,0.0,0.500024812603692,1015.1 
    2015-12-02 04:46:00,1.7,0.5,0.0,0.500024812603692,1015.1 
    2015-12-02 04:53:00,1.7,0.8,0.0,0.500024812603692,1015.1 
    2015-12-02 05:13:00,1.7,0.0,0.0,0.500024812603692,1014.4 

Я хочу получить суточную сумму снега (сбросить на ноль для нового дня) для всего моего набора данных. Я хочу, чтобы мой вывод выглядел так:

    2015-12-01,0.0
    2015-12-02,0.0
    2015-12-03,1.0
    2015-12-04,3.0
    2015-12-05,0.0
    2015-12-06,1.0

Как я могу использовать панды, чтобы сделать это?

2 ответа

Это то, что вы хотите?

df.groupby(df.Datetime.dt.date)['Snow (in.)'].sum()

Это даст вам количество снега (сумма) в день

Вы также можете использовать:

df['Snow (in.)'].resample('D').sum()
Другие вопросы по тегам