R LSA LSAFUN, включая проблемы
Я хотел бы использовать genericSummary
функция из пакета LSAfun
, Вот немецкий пример текста.
library("LSAfun")
text = " Gegen die Firma wurde während der letzten Woche ein Zwangsvollstreckungsverfahren eingeleitet. Darüber witzeln die Konkurrenten."
Кодировка моих текстов - "UTF-8". На самом деле, код этого образца текста "latin1". Поэтому я перешел на utf8
text = enc2utf8(text)
Когда я звоню
genericSummary(text, k=2)
Я получаю следующую ошибку:
Error in FUN(X[[i]], ...) :
[lsa] - could not open file C:\Users\MA\AppData\Local\Temp\RtmpcRnDPw\file16c81a35d06/sentence1.txt due to encoding problems of the file.
Кто-нибудь знает как это решить?
1 ответ
Была такая же проблема. Кажется, что причиной являются специальные символы, такие как "ü" и "ä". Заменив их на 'ue' и 'ae', кодирование будет работать.
попробуйте это: genericSummary(текст,k=2, язык ="немецкий", разбивка =T)
опция разбивки сделает работу, см. также R-help для этой функции.
С наилучшими пожеланиями, Майкл.