Как мне перевести строку даты / времени ISO 8601 в объект даты и времени Python?
Я получаю строку даты и времени в формате, подобном "2009-05-28T16:15:00" (я думаю, это ISO 8601). Один хакерский вариант, кажется, для анализа строки с помощью time.strptime
и передача первых шести элементов кортежа в конструктор datetime, например:
datetime.datetime(*time.strptime("2007-03-04T21:08:12", "%Y-%m-%dT%H:%M:%S")[:6])
Я не смог найти "более чистый" способ сделать это. Есть один?
11 ответов
Я предпочитаю использовать библиотеку dateutil для обработки часовых поясов и, как правило, для точного анализа дат. Если бы вы получили строку ISO 8601, такую как: 2010-05-08T23:41:54.000Z, вам было бы весело проанализировать ее с помощью strptime, особенно если вы не знали заранее, включен ли часовой пояс или нет. У pyiso8601 есть несколько проблем (проверьте их трекер), с которыми я столкнулся во время своего использования, и они не обновлялись в течение нескольких лет. dateutil, напротив, был активным и работал для меня:
import dateutil.parser
yourdate = dateutil.parser.parse(datestring)
С Python 3 и без внешних библиотек:
datetime.datetime.strptime('2019-01-04T16:41:24+0200', "%Y-%m-%dT%H:%M:%S%z")
Python 2 не поддерживает %z
спецификатор формата, так что лучше по возможности использовать время зулу везде, где это возможно:
datetime.datetime.strptime("2007-03-04T21:08:12Z", "%Y-%m-%dT%H:%M:%SZ")
Поскольку ISO 8601 допускает множество вариантов необязательных двоеточий и тире, в основном CCYY-MM-DDThh:mm:ss[Z|(+|-)hh:mm]
, Если вы хотите использовать strptime, вы должны сначала удалить эти варианты.
Цель состоит в том, чтобы сгенерировать объект даты и времени в формате UTC.
Если вы просто хотите базовый случай, который работает для UTC с суффиксом Z, как 2016-06-29T19:36:29.3453Z
:
datetime.datetime.strptime(timestamp.translate(None, ':-'), "%Y%m%dT%H%M%S.%fZ")
Если вы хотите обрабатывать смещения часового пояса, такие как 2016-06-29T19:36:29.3453-0400
или же 2008-09-03T20:56:35.450686+05:00
используйте следующее. Они преобразуют все варианты во что-то без разделителей переменных, таких как 20080903T205635.450686+0500
делая его более последовательным / легче разобрать.
import re
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
datetime.datetime.strptime(conformed_timestamp, "%Y%m%dT%H%M%S.%f%z" )
Если ваша система не поддерживает %z
директива strptime (вы видите что-то вроде ValueError: 'z' is a bad directive in format '%Y%m%dT%H%M%S.%f%z'
) тогда нужно вручную сместить время от Z
(УНИВЕРСАЛЬНОЕ ГЛОБАЛЬНОЕ ВРЕМЯ). Заметка %z
может не работать в вашей системе в версиях Python < 3, так как это зависит от поддержки библиотеки C, которая зависит от типа сборки системы /Python (например, Jython, Cython и т. д.).
import re
import datetime
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
# Split on the offset to remove it. Use a capture group to keep the delimiter
split_timestamp = re.split(r"[+|-]",conformed_timestamp)
main_timestamp = split_timestamp[0]
if len(split_timestamp) == 3:
sign = split_timestamp[1]
offset = split_timestamp[2]
else:
sign = None
offset = None
# Generate the datetime object without the offset at UTC time
output_datetime = datetime.datetime.strptime(main_timestamp +"Z", "%Y%m%dT%H%M%S.%fZ" )
if offset:
# Create timedelta based on offset
offset_delta = datetime.timedelta(hours=int(sign+offset[:-2]), minutes=int(sign+offset[-2:]))
# Offset datetime with timedelta
output_datetime = output_datetime + offset_delta
Стрелка выглядит многообещающе для этого:
>>> import arrow
>>> arrow.get('2014-11-13T14:53:18.694072+00:00').datetime
datetime.datetime(2014, 11, 13, 14, 53, 18, 694072, tzinfo=tzoffset(None, 0))
Arrow - это библиотека Python, которая предоставляет разумный, интеллектуальный способ создания, манипулирования, форматирования и преобразования дат и времени. Стрелка проста, легка и в значительной степени вдохновлена моментом.js и запросами.
Вы должны следить за информацией о часовом поясе, так как вы можете столкнуться с проблемами при сравнении дат времени без поддержки tz с данными tz.
Вероятно, лучше всего всегда делать так, чтобы они знали о tz (даже если только как UTC), если только вы действительно не знаете, почему это бесполезно.
#-----------------------------------------------
import datetime
import pytz
import dateutil.parser
#-----------------------------------------------
utc = pytz.utc
BERLIN = pytz.timezone('Europe/Berlin')
#-----------------------------------------------
def to_iso8601(when=None, tz=BERLIN):
if not when:
when = datetime.datetime.now(tz)
if not when.tzinfo:
when = tz.localize(when)
_when = when.strftime("%Y-%m-%dT%H:%M:%S.%f%z")
return _when[:-8] + _when[-5:] # Remove microseconds
#-----------------------------------------------
def from_iso8601(when=None, tz=BERLIN):
_when = dateutil.parser.parse(when)
if not _when.tzinfo:
_when = tz.localize(_when)
return _when
#-----------------------------------------------
import datetime, time
def convert_enddate_to_seconds(self, ts):
"""Takes ISO 8601 format(string) and converts into epoch time."""
dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+\
datetime.timedelta(hours=int(ts[-5:-3]),
minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
return seconds
Это также включает в себя миллисекунды и часовой пояс.
Если время "2012-09-30T15:31:50.262-08:00", это будет время эпохи.
>>> import datetime, time
>>> ts = '2012-09-30T15:31:50.262-08:00'
>>> dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+ datetime.timedelta(hours=int(ts[-5:-3]), minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
>>> seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
>>> seconds
1348990310.26
В обе стороны:
Время по ISO:
isoTime = time.strftime('%Y-%m-%dT%H:%M:%SZ', time.gmtime(epochTime))
Время ISO до эпохи:
epochTime = time.mktime(time.strptime(isoTime, '%Y-%m-%dT%H:%M:%SZ'))
Вот супер простой способ сделать такие преобразования. Никакого разбора или дополнительных библиотек не требуется. Это чисто, просто и быстро.
import datetime
import time
################################################
#
# Takes the time (in seconds),
# and returns a string of the time in ISO8601 format.
# Note: Timezone is UTC
#
################################################
def TimeToISO8601(seconds):
strKv = datetime.datetime.fromtimestamp(seconds).strftime('%Y-%m-%d')
strKv = strKv + "T"
strKv = strKv + datetime.datetime.fromtimestamp(seconds).strftime('%H:%M:%S')
strKv = strKv +"Z"
return strKv
################################################
#
# Takes a string of the time in ISO8601 format,
# and returns the time (in seconds).
# Note: Timezone is UTC
#
################################################
def ISO8601ToTime(strISOTime):
K1 = 0
K2 = 9999999999
K3 = 0
counter = 0
while counter < 95:
K3 = (K1 + K2) / 2
strK4 = TimeToISO8601(K3)
if strK4 < strISOTime:
K1 = K3
if strK4 > strISOTime:
K2 = K3
counter = counter + 1
return K3
################################################
#
# Takes a string of the time in ISO8601 (UTC) format,
# and returns a python DateTime object.
# Note: returned value is your local time zone.
#
################################################
def ISO8601ToDateTime(strISOTime):
return time.gmtime(ISO8601ToTime(strISOTime))
#To test:
Test = "2014-09-27T12:05:06.9876"
print ("The test value is: " + Test)
Ans = ISO8601ToTime(Test)
print ("The answer in seconds is: " + str(Ans))
print ("And a Python datetime object is: " + str(ISO8601ToDateTime(Test)))