Почему R не может прочитать текстовый файл

Попытайтесь заставить R прочитать мой текстовый файл и сделать анализ текста, но, следуя инструкциям, он не работает, не знаю, что не так. Кто-то плз, помогите мне

library(tm)
setwd("E://")
path="E:/KEYWORDS"
text<-readLines("KEYWORDS.txt")
corpus<- Corpus(VectorSource(text))
corpus<- tm_map(corpus,tolower)
corpus<- tm_map(corpus,removePunctuation)
corpus<-tm_map(corpus,stripWhitespace)
corpus<-Corpus(VectorSource(corpus))
tdm =TermDocumentMatrix(corpus,PlainTextDocument)
findFreTerms(tdm,lowfreq=2)

И это показывает:

Warning message:
In tm_map.SimpleCorpus(corpus, removePunctuation) :
transformation drops documents
tdm =TermDocumentMatrix(corpus,PlainTextDocument)
Error: is.list(control) is not TRUE

И если вы сделаете это

str(readLines("KEYWORDS.txt"))
paste(str(readLines("KEYWORDS.txt")),collapse=" ")
text<-paste(str(readLines("KEYWORDS.txt")),collapse=" ")
gsub(pattern="//W", replace="  ", text)
text<-gsub(pattern="//W",replace=" ",text)
gsub(pattern="//d", replace=" ", text)
text<-gsub(pattern="//d", replace=" ", text1)
tolower(text)
text<-tolower(text)
text

Это показывает, что текст нулевой или содержит 0 символов, почему?

1 ответ

Решение
tdm =TermDocumentMatrix(corpus,PlainTextDocument)
Error: is.list(control) is not TRUE

это потому, что вы дали второй параметр TermDocumentMatrix как PlainTextDocument а не список контрольных аргументов. Прочитайте документацию для TermDocumentMatrix, чтобы увидеть, что является допустимым набором аргументов управления.

Вы говорите, что делаете это, "следуя шагам", но сначала вы должны понять шаги.

Другие вопросы по тегам