Кодировка в R: <> Юникод в букву
У меня проблемы с извлечением комментариев из постов с использованием пакета RFacebook.
localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here
Проблема заключается в кодировке вывода. Например:
algu / U + 00E9 / м
Обратите внимание, что вместо "/" вывод имеет <>
Это слово, например, должно выглядеть как
alguém
Какие-либо предложения?
Заранее спасибо!
1 ответ
Рассмотрите возможность изменения вашего locale
, Это не проблема с Rfacebook
, Я могу повторить описанное вами поведение, установив для locale значение C
например,
x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"
Переключая языковой стандарт для обработки набора символов на язык с расширенным набором символов, достигается желаемый результат, например
Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"
Значение locale
аргумент может отличаться в вашей системе. См. https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html (или ?locales
) для получения дополнительной информации о настройке локалей.