Как определить язык документа - в PHP?
Основы уже были даны ответы здесь. Но есть ли предварительно собранная PHP-библиотека, выполняющая то же самое, что и Lingua::Identify из CPAN?
2 ответа
Решение
Там груша пакет Text_LanguageDetect
что я использовал раньше. Сделай свою работу достаточно хорошо. Я не уверен ни в каких других зрелых людях.
1- Вы могли бы сделать это самостоятельно (трудный путь) - обнаружение как языка, так и кодовой страницы, просматривая частоты символов и n-грамм. Вам понадобится много "обучающих" данных, но это выполнимо.
2- Вы можете запустить Perl-скрипт для обнаружения (гораздо проще).