Распознавание именованных сущностей в Gate с использованием LingPipe
Я использую GATE NLP
обрабатывать мой документ, и я хочу использовать имена объектов для использования в качестве кандидатов тегов В Gate есть OpenNLP
а также LingPipe
как я читаю форму ответа здесь @Shashikant Kore ответ он сказал
если у вас есть предложение "Мой друг Джо Смит пошел в магазин Walmart", OpenNLP идентифицирует две названные сущности - "Джо Смит" и "Walmart". Я не мог получить тег "Джо Смит" как Персона и "Уолмарт" как Организацию.
и предлагает использовать LingPipe
поэтому я использовал LingPipe, который предоставляется в Gate NLP, как здесь
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();
Тем не менее, когда я запускаю свою программу, у меня есть это исключение
Исключение в потоке "main" gate.creole.ResourceInstantiationException: файл модели не предоставлен! в gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) в gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)
что означает "Нет файла модели"? извините, потому что я задаю этот вопрос, но я совершенно новичок в этой области, и я просто узнал об Энни, и ему не понадобился какой-либо файл, когда я использовал его для извлечения POS-тегов любой помощи??
1 ответ
Наконец это работает для меня.
Я старался File
-> Ready Made Applications
-> LingPipe
-> LingPipe IE System
в графическом интерфейсе GATE. И он был загружен в порядке.
Рабочая модель была:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker
Полный соответствующий конфиг для gate.lingpipe.NamedEntityRecognizerPR
было:
...
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
<urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...