Какие функции Apache OpenNLP использует по умолчанию при запуске своих моделей распознавания именованных объектов (NER)?
Я знаю, что Apache OpenNLP использует модель MaxEnt для своего тега NER. Но какие функции Apache OpenNLP использует (по умолчанию) при запуске своих моделей распознавания именованных объектов (NER)? а также как мы можем включить / настроить новые функции в OpenNLP (реализация Java)?
1 ответ
В Apache OpenNLP NER это позволяет пользователям определять функции с помощью файла XML. XML по умолчанию это:
Если вы хотите настроить его, используйте -featuregen
вариант при тренировке модели:
$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...
При запуске TokenNameFinder вам не нужно указывать XML-файл своей пользовательской функции, поскольку файл модели содержит информацию о ваших функциях.