R LSA LSAFUN, включая проблемы

Я хотел бы использовать genericSummary функция из пакета LSAfun, Вот немецкий пример текста.

library("LSAfun")
text = " Gegen die Firma wurde während der letzten Woche ein Zwangsvollstreckungsverfahren eingeleitet. Darüber witzeln die Konkurrenten."

Кодировка моих текстов - "UTF-8". На самом деле, код этого образца текста "latin1". Поэтому я перешел на utf8

text = enc2utf8(text)

Когда я звоню

genericSummary(text, k=2)

Я получаю следующую ошибку:

Error in FUN(X[[i]], ...) : 
  [lsa] - could not open file C:\Users\MA\AppData\Local\Temp\RtmpcRnDPw\file16c81a35d06/sentence1.txt due to encoding problems of the file.

Кто-нибудь знает как это решить?

1 ответ

Была такая же проблема. Кажется, что причиной являются специальные символы, такие как "ü" и "ä". Заменив их на 'ue' и 'ae', кодирование будет работать.

попробуйте это: genericSummary(текст,k=2, язык ="немецкий", разбивка =T)

опция разбивки сделает работу, см. также R-help для этой функции.

С наилучшими пожеланиями, Майкл.

Другие вопросы по тегам