Python время для старения, часть 2: часовые пояса
Исходя из моего предыдущего вопроса Python, время от времени я столкнулся с проблемой, касающейся часового пояса, и оказалось, что он не всегда будет "+0200". Поэтому, когда strptime пытается разобрать его как таковой, он выдает исключение.
Я думал о том, чтобы просто отрубить +0200 с помощью [:-6] или чего-то еще, но есть ли реальный способ сделать это с помощью strptime?
Я использую Python 2.5.2, если это имеет значение.
>>> from datetime import datetime
>>> fmt = "%a, %d %b %Y %H:%M:%S +0200"
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200", fmt)
datetime.datetime(2008, 7, 22, 8, 17, 41)
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0300", fmt)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.5/_strptime.py", line 330, in strptime
(data_string, format))
ValueError: time data did not match format: data=Tue, 22 Jul 2008 08:17:41 +0300 fmt=%a, %d %b %Y %H:%M:%S +0200
5 ответов
Новое в версии 2.6.
Для простого объекта коды формата%z и%Z заменяются пустыми строками.
Похоже, что это реализовано только в>= 2.6, и я думаю, что вы должны проанализировать его вручную.
Я не вижу другого решения, кроме как удалить данные часового пояса:
from datetime import timedelta,datetime
try:
offset = int("Tue, 22 Jul 2008 08:17:41 +0300"[-5:])
except:
print "Error"
delta = timedelta(hours = offset / 100)
fmt = "%a, %d %b %Y %H:%M:%S"
time = datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200"[:-6], fmt)
time -= delta
Есть ли реальный способ сделать это с помощью strptime?
Нет, но так как ваш формат выглядит как дата семейства RFC822, вы можете гораздо проще читать его, используя библиотеку электронной почты:
>>> import email.utils
>>> email.utils.parsedate_tz('Tue, 22 Jul 2008 08:17:41 +0200')
(2008, 7, 22, 8, 17, 41, 0, 1, 0, 7200)
(7200 = смещение часового пояса от UTC в секундах)
Вы можете использовать dateutil
библиотека, которая очень полезна:
from datetime import datetime
from dateutil.parser import parse
dt = parse("Tue, 22 Jul 2008 08:17:41 +0200")
## datetime.datetime(2008, 7, 22, 8, 17, 41, tzinfo=tzoffset(None, 7200)) <- dt
print dt
2008-07-22 08:17:41+02:00
Насколько я знаю, strptime()
не распознает числовые коды часовых поясов. Если вы знаете, что строка всегда заканчивается спецификацией часового пояса этой формы (+ или -, за которой следуют 4 цифры), просто разумно сделать это, просто отключив ее и проанализировав вручную.
Кажется, что%Z соответствует именам часовых поясов, а не смещений.
Например, учитывая:
>>> format = '%a, %d %b %Y %H:%M:%S %Z'
Я могу разобрать:
>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 GMT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)
Хотя кажется, что он ничего не делает с часовым поясом, просто наблюдая, что он существует и действителен:
>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 NZDT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)
Я полагаю, если вы хотите, вы можете найти сопоставление смещений с именами, преобразовать ваши входные данные, а затем проанализировать его. Впрочем, может быть проще просто усечь ввод.