Описание тега polyglot

Набор инструментов для обработки многоязычного текста (NLP) для Python

С домашней страницы:

Polyglot - это конвейер естественного языка, поддерживающий массовые многоязычные приложения.

Особенности:

  • Токенизация (165 языков)
  • Определение языка (196 языков)
  • Распознавание именованных сущностей (40 языков)
  • Часть речевых тегов (16 языков)
  • Анализ настроений (136 языков)
  • Вложения слов (137 языков)
  • Морфологический анализ (135 языков)
  • Транслитерация (69 языков)