Запустив tm_map в Rcloud и вернув многобайтовую ошибку из-за "\" в текстовых данных, как я могу обойти это?
Остальные функции tm_map выполняются без ошибок, но при запуске:
notes.corpus <- tm_map(notes.corpus, removeWords, stopwords("english"))
writeLines(as.character(notes.corpus[[1]]))
Сообщение об ошибке
Ошибка в gsub(sprintf("(*UCP)\b(%s)\b", вставка (сортировка (слова, уменьшение = ИСТИНА)): входная строка 1 недопустима для трассировки UTF-8:
gsub(sprintf("(*UCP)\\b(%s)\\b", paste(sort(words, decreasing = TRUE),collapse = "|")), "", x, perl = TRUE) FUN(content(x), ...) removeWords.PlainTextDocument(X[[i]], ...) FUN(X[[i]], ...) lapply(X, FUN, ...) tm_parLapply(content(x), FUN, ...) tm_map.VCorpus(notes.corpus, removeWords, stopwords("english")) tm_map(notes.corpus, removeWords, stopwords("english"))