Сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)
Я хочу выбрать инструмент для обработки естественного языка для выполнения общих задач, таких как токенизация, обнаружение предложений, различные теги (распознавание имен, POS-теги, ...). мой вопрос состоит из двух частей:
- Каковы критерии выбора инструмента обработки естественного языка?
- Среди (UIMA, LingPipe, Lucene, Gate, Stanford), кто лучше удовлетворяет этим критериям?
а каково ваше предложение?
1 ответ
Решение
Некоторые общие критерии:
- сколько задач я могу выполнить с помощью предоставленных моделей (например, содержит ли инструмент модели для моих задач, таких как испанская токенизация или NER белка)?
- насколько легко мне добавить недостающие инструменты.
Кстати, я бы добавил NLTK в ваш список и его отличную бесплатную сопроводительную книгу.