Какие функции Apache OpenNLP использует по умолчанию при запуске своих моделей распознавания именованных объектов (NER)?

Я знаю, что Apache OpenNLP использует модель MaxEnt для своего тега NER. Но какие функции Apache OpenNLP использует (по умолчанию) при запуске своих моделей распознавания именованных объектов (NER)? а также как мы можем включить / настроить новые функции в OpenNLP (реализация Java)?

1 ответ

В Apache OpenNLP NER это позволяет пользователям определять функции с помощью файла XML. XML по умолчанию это:

https://github.com/apache/opennlp/blob/master/opennlp-tools/src/main/resources/opennlp/tools/namefind/ner-default-features.xml

Если вы хотите настроить его, используйте -featuregen вариант при тренировке модели:

$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...

При запуске TokenNameFinder вам не нужно указывать XML-файл своей пользовательской функции, поскольку файл модели содержит информацию о ваших функциях.

Другие вопросы по тегам