Создайте нашу собственную модель для обучения openNLP и используйте ее в Java

Я новичок в openNLP. Я хочу знать, как построить нашу собственную модель для обучения, чтобы выбрать наши конкретные данные в Java с openNLP. Высоко ценю все ваши ответы.

1 ответ

Решение

В OpenNLP есть несколько обучаемых компонентов. DocumentCategorizer NameFinder Tokenizer POSTagger Chunker Parser

Больше всего я использовал NameFinder (для извлечения / распознавания именованных сущностей) и documentCategorizer, который используется для классификации текста, такого как анализ настроений.

В названии есть обучающий формат, который поможет этому посту понять ошибку OPenNLP и написать наши собственные модели в openNLP.

documentCategorizer имеет другой формат, но довольно прост. взгляните на документы здесь, не на сайте OpenNLP http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.htm

НТН

только что увидел ваш комментарий, поэтому обновление. Вы хотите обучить namefinder для вашего случая использования. Таким образом, вы создаете файл предложений, и в каждом предложении вы аннотируете сущность в предложении, как в приведенной мной ссылке, а затем строите модель. Вам нужно около 15000 предложений, чтобы получить действительно хорошие результаты.

Другие вопросы по тегам