CSV в SQLite в R: слишком много кавычек для символьных столбцов
Я пытаюсь создать рабочий процесс, где я
- Создайте базу данных SQLite, используя R
- Загрузите некоторые (потенциально большие - больше, чем могут поместиться в памяти) файлы CSV в базу данных в виде таблиц
- Сделать анализ с dplyr
Кажется, что-то ниже очень близко к тому, что я хочу, но я не могу понять, почему у меня есть дополнительные кавычки в Species
колонка.
library(dplyr)
write.csv(iris, "iris.csv", row.names = FALSE)
my_db <- src_sqlite("my_db.sqlite3", create = T)
con <- dbConnect("SQLite", dbname = "my_db.sqlite3")
dbWriteTable(con, name="iris", value="iris.csv",
row.names=FALSE, header=TRUE, sep = ",", eol = "\r\n", overwrite = TRUE,
quote = "\"", comment.char = "")
iris_sqlite <- tbl(src_sqlite("my_db.sqlite3"), "iris")
iris_sqlite %>%
collect %>%
str
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 150 obs. of 5 variables:
$ Sepal_Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal_Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal_Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal_Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : chr "\"setosa\"" "\"setosa\"" "\"setosa\"" "\"setosa\""