Получить "встроенные nul(s) найдены во входных данных" при чтении CSV с использованием read.csv()

Question

Получить "встроенные nul(s) найдены во входных данных" при чтении CSV с использованием read.csv()

Я читал в CSV-файл.

Код является:

mydata = read.csv("mycsv.csv", header=True, sep=",", quote="\"")

Получите следующее предупреждение:

Предупреждающее сообщение: В scan(file = file, what = what, sep = sep, quote = quote, dec = dec,: встроенные значения, найденные во входных данных

Теперь некоторые ячейки в моем CSV имеют пропущенные значения, которые представлены "".

Как мне написать этот код, чтобы я не получил предупреждение выше?

51

r

Источник

user1172468 22 апр '14 в 02:42

6 ответов

Решение

Вы можете попробовать использовать skipNul = TRUE вариант.

mydata = read.csv("mycsv.csv", quote = "\"", skipNul = TRUE)

От ?read.csv

Внедренные nuls во входной поток прервут поле, читаемое в данный момент, с предупреждением один раз за вызов сканирования. настройка skipNul = TRUE заставляет их игнорироваться.

Это сработало для меня.

41

Источник

user4076491 25 май '15 в 18:13

Это не имеет ничего общего с кодировкой. Это проблема с чтением нулей в файле. Чтобы справиться с этим, вам нужно передать параметр "skipNul = TRUE".

например: neg = scan('F:/Natural_Language_Processing/negative-words.txt', what = 'character', comment.char = '', encoding = "UTF-8", skipNul = TRUE)

4

Источник

user9981802 23 июн '18 в 10:28

Может быть файл, который не имеет CRLF, может иметь только LF. Попробуйте проверить HEX-вывод файла.

Если так. Попробуйте запустить файл через awk:

awk '{printf "%s\r\n", $0}' file > new_log_file

2

Источник

user1372738 03 дек '14 в 04:14

У меня было то же сообщение об ошибке, и я обнаружил, что, хотя мои файлы имели расширения.csv и открывались без проблем в электронной таблице, они фактически были сохранены как "Все форматы", а не как "Текст CSV (.csv)".

1

Источник

user1736015 15 фев '15 в 18:25

Еще одно быстрое решение:

Дважды проверьте, что вы на самом деле читаете .csv файл!

Я случайно читал .rds файл вместо .csv и получил эту "встроенную нулевую" ошибку.

1

Источник

user3217870 02 апр '19 в 22:42

В этих случаях убедитесь, что импортируемые данные не имеют символов "#", но в этом случае попробуйте использовать параметр comment.char="", Это сработало для меня.

0

Источник

user5830731 17 дек '17 в 18:14

Другие вопросы по тегам r

user1204143 22 апр '14 в 02:45 2014-04-22 02:45 · Accepted Answer · 2014-04-22 02:45

Ваш CSV может быть закодирован в UTF-16. Это не редкость при работе с некоторыми инструментами на базе Windows.

Вы можете попробовать загрузить CSV UTF-16 следующим образом:

read.csv("mycsv.csv", ..., fileEncoding="UTF-16LE")

61

Источник

user1204143 22 апр '14 в 02:45