org.renjin.eval.EvalException: пространство имен org.renjin: в инструментах нет символа с именем.get_internal_S3_generics

Мне нужно извлечь ключевые слова из данных новостей, сохраненных в виде текстового файла, с помощью моего веб-приложения Java. Я использую язык R и Renjin для этого анализа текста (пакет tm с веб-сайта Renjin) и извлекаю ключевые слова. Сценарий действительно работает в RStudio, но не может работать с использованием Renjin в моем веб-приложении на Java. Всякий раз, когда я пытаюсь создать корпус, происходит это исключение. Пожалуйста, предложите мне решение.

org.renjin.eval.EvalException: пространство имен org.renjin: в инструментах нет символа с именем.get_internal_S3_generics

Мой файл сценария R, который читает текстовый файл и записывает ключевые слова с их частотами в CSV-файл, показан ниже:

library(tm)
library(SnowballC)
setwd('/home/lalkrishna/Desktop/keywordtest/')
newsfile <- scan(file = "0e3cdf1b-8fa4-4df0-8977-906d5865008b.txt",what = character() )
news_Corpus <- Corpus(VectorSource(newsfile))
news_Corpus <- tm_map(news_Corpus, removePunctuation) 
news_Corpus <- tm_map(news_Corpus, removeNumbers)
news_Corpus <- tm_map(news_Corpus, tolower)

new_stopwords = scan("/home/lalkrishna/Desktop/keywordtest/stop-wordlist.csv", what = character())
updated_stopword_list = c(stopwords("english"),new_stopwords)

news_Corpus <- tm_map(news_Corpus, removeWords, updated_stopword_list)
news_Corpus <- tm_map(news_Corpus, stemDocument)
news_Corpus <- tm_map(news_Corpus, stripWhitespace)
news_Corpus <- tm_map(news_Corpus, PlainTextDocument)
dtm <- DocumentTermMatrix(news_Corpus)
tdm <- TermDocumentMatrix(news_Corpus)

freqs <- as.data.frame(inspect(dtm))
colSums(freqs)  
which(apply(tdm, 1, sum) > 2)
write.csv(colSums(freqs), file = "term-freq.csv")

0 ответов

Другие вопросы по тегам