Запустив tm_map в Rcloud и вернув многобайтовую ошибку из-за "\" в текстовых данных, как я могу обойти это?

Остальные функции tm_map выполняются без ошибок, но при запуске:

notes.corpus <- tm_map(notes.corpus, removeWords, stopwords("english"))
writeLines(as.character(notes.corpus[[1]]))

Сообщение об ошибке

Ошибка в gsub(sprintf("(*UCP)\b(%s)\b", вставка (сортировка (слова, уменьшение = ИСТИНА)): входная строка 1 недопустима для трассировки UTF-8:

gsub(sprintf("(*UCP)\\b(%s)\\b", 
paste(sort(words, decreasing = TRUE),collapse = "|")), 
"", 
x, 
perl = TRUE) FUN(content(x), ...)
removeWords.PlainTextDocument(X[[i]], ...) FUN(X[[i]], ...) 
lapply(X, FUN, ...) 
tm_parLapply(content(x), FUN, ...)
tm_map.VCorpus(notes.corpus, removeWords, stopwords("english"))
tm_map(notes.corpus, removeWords, stopwords("english"))

0 ответов

Другие вопросы по тегам