Распознавание именованных сущностей в Gate с использованием LingPipe

Я использую GATE NLP обрабатывать мой документ, и я хочу использовать имена объектов для использования в качестве кандидатов тегов В Gate есть OpenNLP а также LingPipe как я читаю форму ответа здесь @Shashikant Kore ответ он сказал

если у вас есть предложение "Мой друг Джо Смит пошел в магазин Walmart", OpenNLP идентифицирует две названные сущности - "Джо Смит" и "Walmart". Я не мог получить тег "Джо Смит" как Персона и "Уолмарт" как Организацию.

и предлагает использовать LingPipe поэтому я использовал LingPipe, который предоставляется в Gate NLP, как здесь

SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
        Corpus corpus = Factory.newCorpus("SegmenterCorpus");
        Document document = Factory.newDocument(handler.toString());
        corpus.add(document); 
        pipeline.setCorpus(corpus); 
        pipeline.execute();

Тем не менее, когда я запускаю свою программу, у меня есть это исключение

Исключение в потоке "main" gate.creole.ResourceInstantiationException: файл модели не предоставлен! в gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) в gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)

что означает "Нет файла модели"? извините, потому что я задаю этот вопрос, но я совершенно новичок в этой области, и я просто узнал об Энни, и ему не понадобился какой-либо файл, когда я использовал его для извлечения POS-тегов любой помощи??

1 ответ

Решение

Наконец это работает для меня.

Я старался File -> Ready Made Applications -> LingPipe -> LingPipe IE System в графическом интерфейсе GATE. И он был загружен в порядке.

Рабочая модель была:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker

Полный соответствующий конфиг для gate.lingpipe.NamedEntityRecognizerPR было:

...    
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
  <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...

Скрепка экрана GATE

Другие вопросы по тегам