Чтение и объединение файлов CSV с различными размерами (nrow, ncol)
У меня есть каталог файлов журналов, разделенных табуляцией, с различными размерами, и я пытаюсь загрузить их в R.
Dir:
File1 (col1,col2,col3)
File2 (col3,col4,col5,col6,col7)
File3 (col1,col8,col9,col10)
Для этого: я объединил все файлы в каталоге: all_files.tsv
Когда я попытался загрузить их в R, как и ожидалось, я получил сообщение об ошибке:
Ошибка сканирования (файл, что, nmax, sep, dec, quote, skip, nlines, na.strings: строка 436 не имела 12 элементов
Код, который я использую:
data <- read.table("all_vid_logs.tsv",
header=FALSE,
sep="\t" # use "\t" for tab-delimited files
)
Итак, мой вопрос: 1. Каков наилучший способ загрузки всех этих файлов в фрейм данных в R?
Результат, который я ожидаю, представляет собой единую плоскую структуру со всеми столбцами.
1 ответ
По-видимому, они имеют разную длину (нроу). затем read.table/read.csv
возможно, не сможет прочитать ваш объединенный файл.
Так что читайте их отдельно в отдельные кадры данных. Затем выясните, какую операцию соединения нужно выполнить с NA-заполнением.
df1 <- read.csv(file1, ...)
df2 <- read.csv(file2, ...)