Как округлить столбец даты и времени до ближайшего квартала
Я загрузил файл данных в фрейм данных Python для панд. У меня есть дата-столбец формата 2015-07-18 13:53:33.280
,
Что мне нужно сделать, это создать новую колонку, которая округляет это до ближайшего четверти часа. Таким образом, дата выше будет округлена до 2015-07-18 13:45:00.000
,
Как мне сделать это в пандах? Я попытался использовать решение отсюда, но получить 'Series' object has no attribute 'year'
ошибка.
5 ответов
Предполагая, что ваша серия состоит из datetime
объекты, которые вы должны использовать Series.apply
, Пример -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
Приведенный выше пример всегда округляется до предыдущего квартала (поведение аналогично функции пола).
РЕДАКТИРОВАТЬ
Округлить до правильного четверть часа (например, если его 7 минут 30 секунд после предыдущего квартала, чтобы показать следующий квартал). Мы можем использовать приведенный ниже пример -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
Выше будет учитываться только самые последние секунды, если вы хотите, чтобы учитывались миллисекунды / микросекунды, вы можете добавить это к вышеприведенному уравнению как - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)
Ты можешь использовать round(freq)
, Также есть ярлык column.dt
для доступа к функциям даты и времени (как подсказывает @laurens-koppenol).
Вот одна строка:
df['old column'].dt.round('15min')
Строковые псевдонимы для действительных частот можно найти здесь. Полный рабочий пример:
In [1]: import pandas as pd
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
pd.Timestamp('2015-07-18 13:33:33.330')],
columns=['old column'])
In [3]: df['new column']=df['old column'].dt.round('15min')
In [4]: df
Out[4]:
old column new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
Это выглядит немного лучше
column.dt.
позволяет функции datetime для столбцов datetime, например column.str.
делает для строковых столбцов
Справочник по API свойств типа даты и времени
import pandas as pd
# test df
df = pd.DataFrame([{'old_column':pd.Timestamp('2015-07-18 13:53:33.280')}])
df['new_column'] = df['old_column'].dt.round('15min')
df
Ответ Ананда С. Кумара не округляется до ближайшей четверти часа, он обрезает минуты до ближайших 15 минут под ним.
Собственно, в вашем примере 2015-07-18 13:53:33.280
должен округлить до 2015-07-18 14:00:00.000
поскольку 53:33.280
ближе к 60 минутам, чем к 45 минутам.
Я нашел более надежный ответ для округления в этом посте.
Для вашей ситуации это должно работать:
import datetime
def round_time(time, round_to):
"""roundTo is the number of minutes to round to"""
rounded = time + datetime.timedelta(minutes=round_to/2.)
rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
seconds=rounded.second,
microseconds=rounded.microsecond)
return rounded
dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
Если вас устраивает округление до ближайших четверти часа, выполните.dt.to_freq('15min')
тоже будет работать. Обратите внимание, что это изменит dtype, что может быть желательно.