Панды, повторная выборка со средневзвешенным
Я хочу знать, как выполнить повторную выборку со средневзвешенным значением для каждого столбца на основе времени между каждым измерением.
Вот фрагмент данных (первый столбец в м³/ ч, а второй в%):
DEBITS VOLETS
datetime
2014-01-21 00:03:03 NaN 49.93
2014-01-21 00:09:54 55.40 NaN
2014-01-21 00:12:59 NaN 47.72
2014-01-21 00:19:51 48.18 NaN
2014-01-21 00:22:57 NaN 49.44
2014-01-21 00:30:00 65.50 NaN
2014-01-21 00:33:04 NaN 49.37
2014-01-21 00:39:55 63.24 NaN
2014-01-21 00:43:00 NaN 49.69
2014-01-21 00:49:52 65.13 NaN
2014-01-21 00:52:57 NaN 48.75
2014-01-21 00:59:59 47.75 NaN
2014-01-21 01:03:05 NaN 48.50
2014-01-21 01:09:57 61.09 NaN
2014-01-21 01:13:01 NaN 48.16
2014-01-21 01:19:51 58.56 NaN
2014-01-21 01:22:57 NaN 50.09
2014-01-21 01:29:59 62.69 NaN
2014-01-21 01:33:04 NaN 48.55
2014-01-21 01:39:56 56.73 NaN
2014-01-21 01:43:01 NaN 49.06
2014-01-21 01:49:52 56.73 NaN
2014-01-21 01:52:57 NaN 48.73
2014-01-21 01:59:58 62.60 NaN
Вопрос изменен 2 июля 2014 г.
Я знаю, что мне нужно использовать функцию в качестве параметра "как", но я не знаю, как ее сформулировать.
df.resample('H', how='mean')
Но я думаю, что следует использовать np.average библиотечной функции numpy, но NaN, похоже, вызывает ошибку.
np.average(data['DEBITS'], weights=data.index)
Как сформулировать эти две функции вместе, чтобы получить средневзвешенное значение?
Спасибо заранее за вашу помощь.