Текстовая аналитика в R (Создание облака слов с хинди)
Я работаю над проектом текстовой аналитики, имея текстовый файл с текстовыми сообщениями на хинди и английском языке. Я могу читать текст на английском языке, но специальные символы появляются везде, где есть сообщение на хинди.
Я хочу создать облако слов и провести анализ настроений как хинди, так и английских слов одновременно. Может ли какое-нибудь тело помочь мне? Как я могу прочитать сообщение хинди также в R.
Прежде всего, я не могу начать, поскольку я не могу прочитать файл?
Я использовал кодировку файлов как UTF-8 также для обработки специальных символов.
Код, который я использую
Message <- readtext("C:/Users/admin/Desktop/Text_Body.txt",
encoding = "UTF-8", sep = ",", header = TRUE)