R read_excel readxl иногда неправильно конвертирует числа в даты

Когда я использую read_excel для импорта данных из Excel в R, некоторые числовые столбцы автоматически преобразуются в даты.

# e.g.
5600 to 1915-05-01

Есть ли способ выключить эту функцию? Кроме использования аргумента "col_types" в read_excel.

1 ответ

Решение

readxl пакет, как readr для файлов необработанных данных, имеет тип guesser, чтобы определить, как читать столбцы в электронной таблице Excel. Как отмечено в виньетке пакета, процесс угадывания не идеален, особенно в том, что касается форматов даты, поскольку они хранятся в виде специального типа числа.

Как указано в документации к пакету (а также в комментариях к OP), способ избежать неточных предположений от типа столбца guesser заключается в явном указании типов столбца с помощью col_types спор о read_excel(),

Другие вопросы по тегам