Текстовая аналитика в R (Создание облака слов с хинди)

Question

Текстовая аналитика в R (Создание облака слов с хинди)

Я работаю над проектом текстовой аналитики, имея текстовый файл с текстовыми сообщениями на хинди и английском языке. Я могу читать текст на английском языке, но специальные символы появляются везде, где есть сообщение на хинди.

Я хочу создать облако слов и провести анализ настроений как хинди, так и английских слов одновременно. Может ли какое-нибудь тело помочь мне? Как я могу прочитать сообщение хинди также в R.

Прежде всего, я не могу начать, поскольку я не могу прочитать файл?

Я использовал кодировку файлов как UTF-8 также для обработки специальных символов.

Ошибочный файл

Код, который я использую

Message <- readtext("C:/Users/admin/Desktop/Text_Body.txt", 
                    encoding = "UTF-8", sep = ",", header = TRUE)

0

r text-analysis

Источник

user9835286 23 май '18 в 14:49

0 ответов

Другие вопросы по тегам r text-analysis