Описание тега polyglot
Набор инструментов для обработки многоязычного текста (NLP) для Python
Polyglot - это конвейер естественного языка, поддерживающий массовые многоязычные приложения.
Особенности:
- Токенизация (165 языков)
- Определение языка (196 языков)
- Распознавание именованных сущностей (40 языков)
- Часть речевых тегов (16 языков)
- Анализ настроений (136 языков)
- Вложения слов (137 языков)
- Морфологический анализ (135 языков)
- Транслитерация (69 языков)