Ошибка в TDM при попытке построить соотношение условий

Я работал над сценарием для проекта по извлечению текста. Шаги следующие: Чтение таблицы.csv (учебный файл): 95 строк, 14 переменных. Создание корпуса, Очистка, Визуализация. Теперь скрипт для этих шагов выглядит следующим образом:

jdc_prueba <- read_delim("prueba\\jdc_prueba.csv", ";", escape_double = FALSE, trim_ws = TRUE)
jdc_posts<-jdc_prueba$post_message
jdc_source<-VectorSource(jdc_posts)
jdc_corpus<-VCorpus(jdc_source)

jdc_clean=tm_map(jdc_corpus, stripWhitespace)
jdc_clean=tm_map(jdc_clean, removePunctuation)
jdc_clean=tm_map(jdc_clean, removeNumbers)
jdc_clean=tm_map(jdc_clean, tolower)
jdc_clean=tm_map(jdc_clean, removeWords, stopwords("es"))
jdc_clean=tm_map(jdc_clean, PlainTextDocument

jdc_tdm<-TermDocumentMatrix(jdc_clean)
jdc_m3<-as.matrix(jdc_tdm)
jdc_tdm_rm_sparse=removeSparseTerms(jdc_tdm, 0.95)
#remove sparse terms
jdc_m4=as.matrix(jdc_tdm_rm_sparse)

freqControl=5
plot(jdc_tdm_rm_sparse, terms=findFreqTerms(jdc_tdm_rm_sparse,lowfreq=5)[1:50], corThreshold=0.4, main="Correlación entre Términos")

И вот где отображается следующая ошибка.

Error in `[.simple_triplet_matrix`(m, , terms) : NA indices not allowed.

Теперь я попробовал решения, которые утверждают, что установка и загрузка SnowBallC, а также создание другого Корпуса после процесса "очистки" tm_map безуспешно. Я новичок, поэтому, если кто-нибудь сможет мне помочь, я буду очень признателен.

0 ответов

Другие вопросы по тегам