Readr: у read_csv есть проблемы с конкретными датами

Недавно я нашел веб-сайт с данными о преступности в Чикаго, который предлагает экспорт CSV. После импорта записи 6.2M+ с readr я заметил, что все записи Date со временем между 12:00:00 и 12:59:59 PM не могут быть прочитаны.

Я использовал следующее для импорта:

chicagocrime = read_csv ("~ / R / chicago_Crime / Crimes _-_ 2001_to_present 20161203.csv", 
                         col_types = cols (Date = col_datetime (format = "% m /% d /% Y% H:% M:% S% p"), 
                              Местоположение = col_skip(), 
                              `Обновлено включено` = col_skip(), 
                              `X Coordinate` = col_skip(), 
                              `Y Coordinate` = col_skip()))

Задачи () показали следующее:

проблемы (chicagocrime)
# Тиббл: 156 × 4 строка col ожидаемая фактическая 1 12 Дата действительной даты 13.06.2005 12:40:00 PM
2     20 Дата действительной даты 04/06/2005 12:30:00 PM
3     24 Дата дата вступления в силу 13.06.2005 12:45:00 PM
4     32 Дата вступления в силу 06.12.2005 12:00:00 PM
5     43 Дата вступления в силу 06.03.2005 12:00:00 PM 6 53 Дата вступления в силу 20/03/2005 12:00:00 PM
7     61 Дата действительной даты 15.06.2005 12:33:00 PM
8     80 Дата действительной даты 13.06.2005 12:30:00 PM 9 104 Дата действительной даты 06 / 13/2005 12:46:17 10 143 Дата действительной даты 06/12/2005 12:12:30 PM

Все остальное время импортируем без проблем.

Входной файл имеет поле Дата в следующем формате: "06.04.2005, 12:30:00". Любая помощь или комментарии? (R 3.3.2 в Windows 10, последние пакеты)

1 ответ

Вам нужно использовать %I вместо %H, как отмечено в этом сообщении об ошибке. Это не было задокументировано, поэтому я отправил запрос на добавление, добавив примечание об этом в документацию.

Другие вопросы по тегам