Readr: у read_csv есть проблемы с конкретными датами
Недавно я нашел веб-сайт с данными о преступности в Чикаго, который предлагает экспорт CSV. После импорта записи 6.2M+ с readr я заметил, что все записи Date со временем между 12:00:00 и 12:59:59 PM не могут быть прочитаны.
Я использовал следующее для импорта:
chicagocrime = read_csv ("~ / R / chicago_Crime / Crimes _-_ 2001_to_present 20161203.csv", col_types = cols (Date = col_datetime (format = "% m /% d /% Y% H:% M:% S% p"), Местоположение = col_skip(), `Обновлено включено` = col_skip(), `X Coordinate` = col_skip(), `Y Coordinate` = col_skip()))
Задачи () показали следующее:
проблемы (chicagocrime) # Тиббл: 156 × 4 строка col ожидаемая фактическая 1 12 Дата действительной даты 13.06.2005 12:40:00 PM 2 20 Дата действительной даты 04/06/2005 12:30:00 PM 3 24 Дата дата вступления в силу 13.06.2005 12:45:00 PM 4 32 Дата вступления в силу 06.12.2005 12:00:00 PM 5 43 Дата вступления в силу 06.03.2005 12:00:00 PM 6 53 Дата вступления в силу 20/03/2005 12:00:00 PM 7 61 Дата действительной даты 15.06.2005 12:33:00 PM 8 80 Дата действительной даты 13.06.2005 12:30:00 PM 9 104 Дата действительной даты 06 / 13/2005 12:46:17 10 143 Дата действительной даты 06/12/2005 12:12:30 PM
Все остальное время импортируем без проблем.
Входной файл имеет поле Дата в следующем формате: "06.04.2005, 12:30:00". Любая помощь или комментарии? (R 3.3.2 в Windows 10, последние пакеты)
1 ответ
Вам нужно использовать %I
вместо %H
, как отмечено в этом сообщении об ошибке. Это не было задокументировано, поэтому я отправил запрос на добавление, добавив примечание об этом в документацию.