Кодировка в R: <> Юникод в букву

У меня проблемы с извлечением комментариев из постов с использованием пакета RFacebook.

localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here

Проблема заключается в кодировке вывода. Например:

algu / U + 00E9 / м

Обратите внимание, что вместо "/" вывод имеет <>

Это слово, например, должно выглядеть как

alguém

Какие-либо предложения?

Заранее спасибо!

1 ответ

Решение

Рассмотрите возможность изменения вашего locale, Это не проблема с Rfacebook, Я могу повторить описанное вами поведение, установив для locale значение Cнапример,

x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"

Переключая языковой стандарт для обработки набора символов на язык с расширенным набором символов, достигается желаемый результат, например

Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"

Значение locale аргумент может отличаться в вашей системе. См. https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html (или ?locales) для получения дополнительной информации о настройке локалей.

Другие вопросы по тегам