Чтение и объединение файлов CSV с различными размерами (nrow, ncol)

Question

У меня есть каталог файлов журналов, разделенных табуляцией, с различными размерами, и я пытаюсь загрузить их в R.

Dir:
File1 (col1,col2,col3)
File2 (col3,col4,col5,col6,col7)
File3 (col1,col8,col9,col10)

Для этого: я объединил все файлы в каталоге: all_files.tsv

Когда я попытался загрузить их в R, как и ожидалось, я получил сообщение об ошибке:

Ошибка сканирования (файл, что, nmax, sep, dec, quote, skip, nlines, na.strings: строка 436 не имела 12 элементов

Код, который я использую:

 data <- read.table("all_vid_logs.tsv",
                   header=FALSE,
                   sep="\t"         # use "\t" for tab-delimited files
    )

Итак, мой вопрос: 1. Каков наилучший способ загрузки всех этих файлов в фрейм данных в R?

Результат, который я ожидаю, представляет собой единую плоскую структуру со всеми столбцами.

r dimensions read.csv ragged

Источник

user2454478 08 апр '15 в 00:06

1 ответ

Другие вопросы по тегам r dimensions read.csv ragged

user202229 08 апр '15 в 00:10 2015-04-08 00:10 · Answer 1 · 2015-04-08 00:10

По-видимому, они имеют разную длину (нроу). затем read.table/read.csv возможно, не сможет прочитать ваш объединенный файл.

Так что читайте их отдельно в отдельные кадры данных. Затем выясните, какую операцию соединения нужно выполнить с NA-заполнением.

df1 <- read.csv(file1, ...)
df2 <- read.csv(file2, ...)