Почему R не может прочитать текстовый файл

Question

Почему R не может прочитать текстовый файл

Попытайтесь заставить R прочитать мой текстовый файл и сделать анализ текста, но, следуя инструкциям, он не работает, не знаю, что не так. Кто-то плз, помогите мне

library(tm)
setwd("E://")
path="E:/KEYWORDS"
text<-readLines("KEYWORDS.txt")
corpus<- Corpus(VectorSource(text))
corpus<- tm_map(corpus,tolower)
corpus<- tm_map(corpus,removePunctuation)
corpus<-tm_map(corpus,stripWhitespace)
corpus<-Corpus(VectorSource(corpus))
tdm =TermDocumentMatrix(corpus,PlainTextDocument)
findFreTerms(tdm,lowfreq=2)

И это показывает:

Warning message:
In tm_map.SimpleCorpus(corpus, removePunctuation) :
transformation drops documents
tdm =TermDocumentMatrix(corpus,PlainTextDocument)
Error: is.list(control) is not TRUE

И если вы сделаете это

str(readLines("KEYWORDS.txt"))
paste(str(readLines("KEYWORDS.txt")),collapse=" ")
text<-paste(str(readLines("KEYWORDS.txt")),collapse=" ")
gsub(pattern="//W", replace="  ", text)
text<-gsub(pattern="//W",replace=" ",text)
gsub(pattern="//d", replace=" ", text)
text<-gsub(pattern="//d", replace=" ", text1)
tolower(text)
text<-tolower(text)
text

Это показывает, что текст нулевой или содержит 0 символов, почему?

-1

r text-mining

Источник

user10208144 10 авг '18 в 11:32

1 ответ

Решение

Другие вопросы по тегам r text-mining

user211116 10 авг '18 в 11:42 2018-08-10 11:42 · Accepted Answer · 2018-08-10 11:42

tdm =TermDocumentMatrix(corpus,PlainTextDocument)
Error: is.list(control) is not TRUE

это потому, что вы дали второй параметр TermDocumentMatrix как PlainTextDocument а не список контрольных аргументов. Прочитайте документацию для TermDocumentMatrix, чтобы увидеть, что является допустимым набором аргументов управления.

Вы говорите, что делаете это, "следуя шагам", но сначала вы должны понять шаги.