Описание тега cleartk

С веб-сайта "ClearTK" предоставляется структура для разработки компонентов статистической обработки естественного языка (NLP) в Java, которая построена на основе Apache UIMA. Она разработана Центром исследований в области вычислительного языка и образования (CLEAR) в Университете Колорадо в Боулдере. Пожалуйста, ознакомьтесь с концептуальным обзором для широкого ознакомления с ClearTK."

С сайта:

Характеристики

  • Общий интерфейс и оболочки для популярных библиотек машинного обучения, таких как SVMlight, LIBSVM, LIBLINEAR, OpenNLP MaxEnt и Mallet.
  • Богатая библиотека извлечения функций, которую можно использовать с любыми классификаторами машинного обучения. Под прикрытием ClearTK понимает каждую из собственных библиотек машинного обучения и переводит ваши функции в формат, соответствующий любой используемой модели.
  • Инфраструктура для создания компонентов NLP для конкретных задач, таких как маркировка части речи, разбиение на фрагменты в стиле BIO, распознавание именованных объектов, маркировка семантических ролей, маркировка временных отношений и т. Д.
  • Оболочки для распространенных инструментов NLP, таких как средство запуска Snowball, инструменты OpenNLP, анализатор зависимостей MaltParser и инструменты Stanford CoreNLP.
  • Считыватели корпусов для таких коллекций, как Penn Treebank, ACE 2005, CoNLL 2003, Genia, TimeBank и TempEval.