Сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)

Я хочу выбрать инструмент для обработки естественного языка для выполнения общих задач, таких как токенизация, обнаружение предложений, различные теги (распознавание имен, POS-теги, ...). мой вопрос состоит из двух частей:

  1. Каковы критерии выбора инструмента обработки естественного языка?
  2. Среди (UIMA, LingPipe, Lucene, Gate, Stanford), кто лучше удовлетворяет этим критериям?

а каково ваше предложение?

1 ответ

Решение

Некоторые общие критерии:

  1. сколько задач я могу выполнить с помощью предоставленных моделей (например, содержит ли инструмент модели для моих задач, таких как испанская токенизация или NER белка)?
  2. насколько легко мне добавить недостающие инструменты.

Кстати, я бы добавил NLTK в ваш список и его отличную бесплатную сопроводительную книгу.

Другие вопросы по тегам