Как выбрать систему разрешения Coreference в Стэнфорде CoreNLP

Я пытаюсь протестировать систему разрешения coreference от core-nlp. Начиная с разрешения разрешения базовых параметров для необработанного текста, я понимаю настройку общих свойств для системы dcoref.

Я хотел бы выбрать между системами сопутствующих ссылок [Детерминированные, Статистические, Нейронные], основанные на задержке модуля. Использование командной строки понятно для меня, как я могу использовать эту опцию в качестве API?.

В настоящее время я использую код по умолчанию:

public static void main(String[] args) throws Exception {
    Annotation document = new Annotation("Barack Obama was born in Hawaii.  He is the president. Obama was elected in 2008.");
    Properties props = new Properties();
    props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,parse,mention,coref");
    StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
    pipeline.annotate(document);
    System.out.println("---");
    System.out.println("coref chains");
    for (CorefChain cc : document.get(CorefCoreAnnotations.CorefChainAnnotation.class).values()) {
      System.out.println("\t" + cc);
    }
    for (CoreMap sentence : document.get(CoreAnnotations.SentencesAnnotation.class)) {
      System.out.println("---");
      System.out.println("mentions");
      for (Mention m : sentence.get(CorefCoreAnnotations.CorefMentionsAnnotation.class)) {
        System.out.println("\t" + m);
       }
    }

1 ответ

W, после выкапывания corefProperties.class Я узнал свойства, которые нужно изменить.

 props.setProperty("coref.language", "en");
 props.setProperty("coref.algorithm", "statistical");//"statistical" : "neural"

Но что более удивительно, это выполнить приведенный выше пример тестового текста. Statistical method занимает около 45 секунд и Neural занимает около 30 секунд. (Intel i5 @2,00 ГГц, 8 ГБ памяти). Я что-то здесь упускаю?

Другие вопросы по тегам