Преобразование текстовых данных в формат таблицы / CSV
Мне нужно преобразовать текстовые данные (например, абзац) в фрейм данных (чтобы сохранить в виде файла CSV), используя R. Конкретная необходимость состоит в том, чтобы каждое слово в каждом абзаце в отдельной ячейке в столбце. Следующий код преобразует текст в таблицу, но он помещает слова в каждой строке в одну ячейку. Можете ли вы помочь создать набор данных из одного столбца с каждым словом в отдельной ячейке?
merchant <- read.delim("merchant.txt")
write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
1 ответ
Решение
Вот моя попытка, основанная на Tidyverse. Вместо того, чтобы читать как таблицу, просто читайте как строку, а затем разделяйте на вектор отдельных слов:
library(tidyverse)
## Read in text file as string
merchant <- read_file("merchant.txt") %>%
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]
Чтобы преобразовать это в фрейм данных:
para <- as.data.frame(para)