Как определить язык документа - в PHP?

Основы уже были даны ответы здесь. Но есть ли предварительно собранная PHP-библиотека, выполняющая то же самое, что и Lingua::Identify из CPAN?

2 ответа

Решение

Там груша пакет Text_LanguageDetect что я использовал раньше. Сделай свою работу достаточно хорошо. Я не уверен ни в каких других зрелых людях.

1- Вы могли бы сделать это самостоятельно (трудный путь) - обнаружение как языка, так и кодовой страницы, просматривая частоты символов и n-грамм. Вам понадобится много "обучающих" данных, но это выполнимо.

2- Вы можете запустить Perl-скрипт для обнаружения (гораздо проще).

Другие вопросы по тегам