Описание тега treetagger

TreeTagger - это инструмент для аннотирования текста с помощью части речи и информации леммы.

Он был разработан Гельмутом Шмидом в рамках проекта TC в Институте компьютерной лингвистики Университета Штутгарта. TreeTagger - это программа, разработанная Гельмутом Шмидом из Университета Штутгарта (ныне Университет Мюнхена) для частичной речевая маркировка и лемматизация. Языковые модели (известные как "параметры", расширение файла.par) поставляются на веб-странице TreeTagger для использования программы с текстами на английском, французском, немецком, итальянском, испанском, русском, болгарском, голландском, эстонском, финском, галисийском, латыни., Монгольский, польский, словацкий и суахили, а также модели для некоторых других языков доступны на сайтах, связанных с веб-страницей TreeTagger. Для языка, для которого не существует модели, необходимо вручную пометить текст, а затем запустить программу обучения (поставляемую с TreeTagger) для создания модели.