Java chardet, который обнаруживает iso-8859-2
Существует ли версия Python chardet, которая обнаруживает iso-8859-2? Я пробовал Mozilla universalchardet и jchardet, и ни один из них не работал, они оба догадались о windows-1252, но Python chardet, поставляемый с Linux, обнаружил это просто замечательно.
1 ответ
Решение
Я хорошо поработал с IBM ICU4J для определения кодировки, что касается ISO-8859-2 ( http://site.icu-project.org/), он неизменно давал лучшие (наиболее точные) результаты для файлы, которые мы использовали для тестов. Я не сталкивался с Java-версией Python Chardet при проведении исследований.