Преобразование текстовых данных в формат таблицы / CSV

Мне нужно преобразовать текстовые данные (например, абзац) в фрейм данных (чтобы сохранить в виде файла CSV), используя R. Конкретная необходимость состоит в том, чтобы каждое слово в каждом абзаце в отдельной ячейке в столбце. Следующий код преобразует текст в таблицу, но он помещает слова в каждой строке в одну ячейку. Можете ли вы помочь создать набор данных из одного столбца с каждым словом в отдельной ячейке?

    merchant <- read.delim("merchant.txt")
    write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)

1 ответ

Решение

Вот моя попытка, основанная на Tidyverse. Вместо того, чтобы читать как таблицу, просто читайте как строку, а затем разделяйте на вектор отдельных слов:

library(tidyverse)

## Read in text file as string
merchant <- read_file("merchant.txt") %>% 
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]

Чтобы преобразовать это в фрейм данных:

para <- as.data.frame(para)
Другие вопросы по тегам