Как мне перевести строку даты / времени ISO 8601 в объект даты и времени Python?

Я получаю строку даты и времени в формате, подобном "2009-05-28T16:15:00" (я думаю, это ISO 8601). Один хакерский вариант, кажется, для анализа строки с помощью time.strptime и передача первых шести элементов кортежа в конструктор datetime, например:

datetime.datetime(*time.strptime("2007-03-04T21:08:12", "%Y-%m-%dT%H:%M:%S")[:6])

Я не смог найти "более чистый" способ сделать это. Есть один?

11 ответов

Решение

Я предпочитаю использовать библиотеку dateutil для обработки часовых поясов и, как правило, для точного анализа дат. Если бы вы получили строку ISO 8601, такую ​​как: 2010-05-08T23:41:54.000Z, вам было бы весело проанализировать ее с помощью strptime, особенно если вы не знали заранее, включен ли часовой пояс или нет. У pyiso8601 есть несколько проблем (проверьте их трекер), с которыми я столкнулся во время своего использования, и они не обновлялись в течение нескольких лет. dateutil, напротив, был активным и работал для меня:

import dateutil.parser
yourdate = dateutil.parser.parse(datestring)

С Python 3 и без внешних библиотек:

datetime.datetime.strptime('2019-01-04T16:41:24+0200', "%Y-%m-%dT%H:%M:%S%z")

Python 2 не поддерживает %z спецификатор формата, так что лучше по возможности использовать время зулу везде, где это возможно:

datetime.datetime.strptime("2007-03-04T21:08:12Z", "%Y-%m-%dT%H:%M:%SZ")

Поскольку ISO 8601 допускает множество вариантов необязательных двоеточий и тире, в основном CCYY-MM-DDThh:mm:ss[Z|(+|-)hh:mm], Если вы хотите использовать strptime, вы должны сначала удалить эти варианты.

Цель состоит в том, чтобы сгенерировать объект даты и времени в формате UTC.


Если вы просто хотите базовый случай, который работает для UTC с суффиксом Z, как 2016-06-29T19:36:29.3453Z:

datetime.datetime.strptime(timestamp.translate(None, ':-'), "%Y%m%dT%H%M%S.%fZ")

Если вы хотите обрабатывать смещения часового пояса, такие как 2016-06-29T19:36:29.3453-0400 или же 2008-09-03T20:56:35.450686+05:00 используйте следующее. Они преобразуют все варианты во что-то без разделителей переменных, таких как 20080903T205635.450686+0500 делая его более последовательным / легче разобрать.

import re
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
datetime.datetime.strptime(conformed_timestamp, "%Y%m%dT%H%M%S.%f%z" )

Если ваша система не поддерживает %z директива strptime (вы видите что-то вроде ValueError: 'z' is a bad directive in format '%Y%m%dT%H%M%S.%f%z') тогда нужно вручную сместить время от Z (УНИВЕРСАЛЬНОЕ ГЛОБАЛЬНОЕ ВРЕМЯ). Заметка %z может не работать в вашей системе в версиях Python < 3, так как это зависит от поддержки библиотеки C, которая зависит от типа сборки системы /Python (например, Jython, Cython и т. д.).

import re
import datetime

# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)

# Split on the offset to remove it. Use a capture group to keep the delimiter
split_timestamp = re.split(r"[+|-]",conformed_timestamp)
main_timestamp = split_timestamp[0]
if len(split_timestamp) == 3:
    sign = split_timestamp[1]
    offset = split_timestamp[2]
else:
    sign = None
    offset = None

# Generate the datetime object without the offset at UTC time
output_datetime = datetime.datetime.strptime(main_timestamp +"Z", "%Y%m%dT%H%M%S.%fZ" )
if offset:
    # Create timedelta based on offset
    offset_delta = datetime.timedelta(hours=int(sign+offset[:-2]), minutes=int(sign+offset[-2:]))

    # Offset datetime with timedelta
    output_datetime = output_datetime + offset_delta

Стрелка выглядит многообещающе для этого:

>>> import arrow
>>> arrow.get('2014-11-13T14:53:18.694072+00:00').datetime
datetime.datetime(2014, 11, 13, 14, 53, 18, 694072, tzinfo=tzoffset(None, 0))

Arrow - это библиотека Python, которая предоставляет разумный, интеллектуальный способ создания, манипулирования, форматирования и преобразования дат и времени. Стрелка проста, легка и в значительной степени вдохновлена моментом.js и запросами.

Вы должны следить за информацией о часовом поясе, так как вы можете столкнуться с проблемами при сравнении дат времени без поддержки tz с данными tz.

Вероятно, лучше всего всегда делать так, чтобы они знали о tz (даже если только как UTC), если только вы действительно не знаете, почему это бесполезно.

#-----------------------------------------------
import datetime
import pytz
import dateutil.parser
#-----------------------------------------------

utc = pytz.utc
BERLIN = pytz.timezone('Europe/Berlin')
#-----------------------------------------------

def to_iso8601(when=None, tz=BERLIN):
  if not when:
    when = datetime.datetime.now(tz)
  if not when.tzinfo:
    when = tz.localize(when)
  _when = when.strftime("%Y-%m-%dT%H:%M:%S.%f%z")
  return _when[:-8] + _when[-5:] # Remove microseconds
#-----------------------------------------------

def from_iso8601(when=None, tz=BERLIN):
  _when = dateutil.parser.parse(when)
  if not _when.tzinfo:
    _when = tz.localize(_when)
  return _when
#-----------------------------------------------

Я еще не пробовал, но pyiso8601 обещает поддержать это.

import datetime, time
def convert_enddate_to_seconds(self, ts):
    """Takes ISO 8601 format(string) and converts into epoch time."""
    dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+\
                datetime.timedelta(hours=int(ts[-5:-3]),
                minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
    seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
    return seconds

Это также включает в себя миллисекунды и часовой пояс.

Если время "2012-09-30T15:31:50.262-08:00", это будет время эпохи.

>>> import datetime, time
>>> ts = '2012-09-30T15:31:50.262-08:00'
>>> dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+ datetime.timedelta(hours=int(ts[-5:-3]), minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
>>> seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
>>> seconds
1348990310.26

В обе стороны:

Время по ISO:

isoTime = time.strftime('%Y-%m-%dT%H:%M:%SZ', time.gmtime(epochTime))

Время ISO до эпохи:

epochTime = time.mktime(time.strptime(isoTime, '%Y-%m-%dT%H:%M:%SZ'))

Кажется, Isodate имеет наиболее полную поддержку.

aniso8601 должен справиться с этим. Он также понимает часовые пояса, Python 2 и Python 3, и имеет разумное покрытие остальной части ISO 8601, если вам когда-либо понадобится.

import aniso8601
aniso8601.parse_datetime('2007-03-04T21:08:12')

Вот супер простой способ сделать такие преобразования. Никакого разбора или дополнительных библиотек не требуется. Это чисто, просто и быстро.

import datetime
import time

################################################
#
# Takes the time (in seconds),
#   and returns a string of the time in ISO8601 format.
# Note: Timezone is UTC
#
################################################

def TimeToISO8601(seconds):
   strKv = datetime.datetime.fromtimestamp(seconds).strftime('%Y-%m-%d')
   strKv = strKv + "T"
   strKv = strKv + datetime.datetime.fromtimestamp(seconds).strftime('%H:%M:%S')
   strKv = strKv +"Z"
   return strKv

################################################
#
# Takes a string of the time in ISO8601 format,
#   and returns the time (in seconds).
# Note: Timezone is UTC
#
################################################

def ISO8601ToTime(strISOTime):
   K1 = 0
   K2 = 9999999999
   K3 = 0
   counter = 0
   while counter < 95:
     K3 = (K1 + K2) / 2
     strK4 = TimeToISO8601(K3)
     if strK4 < strISOTime:
       K1 = K3
     if strK4 > strISOTime:
       K2 = K3
     counter = counter + 1
   return K3

################################################
#
# Takes a string of the time in ISO8601 (UTC) format,
#   and returns a python DateTime object.
# Note: returned value is your local time zone.
#
################################################

def ISO8601ToDateTime(strISOTime):
   return time.gmtime(ISO8601ToTime(strISOTime))


#To test:
Test = "2014-09-27T12:05:06.9876"
print ("The test value is: " + Test)
Ans = ISO8601ToTime(Test)
print ("The answer in seconds is: " + str(Ans))
print ("And a Python datetime object is: " + str(ISO8601ToDateTime(Test)))
Другие вопросы по тегам