Как подготовить одну модель для OpenNLP Name Entity из нескольких файлов в DKPro Core?

Как подготовить одну модель из нескольких файлов в DKPro Core?

После аннотирования многих документов в WebAnno и экспорта в формат XMI я попытался создать модель с таким кодом:

        File model = new File("/tmp/", "model.bin");

    SimplePipeline.runPipeline(CollectionReaderFactory.createReaderDescription(XmiReader.class,
            ResourceCollectionReaderBase.PARAM_SOURCE_LOCATION, "/tmp/",
            ResourceCollectionReaderBase.PARAM_PATTERNS, ResourceCollectionReaderBase.INCLUDE_PREFIX + "*.xmi"),
            AnalysisEngineFactory.createEngineDescription(OpenNlpNamedEntityRecognizerTrainer.class,
                    OpenNlpNamedEntityRecognizerTrainer.PARAM_TARGET_LOCATION, model,
                    OpenNlpNamedEntityRecognizerTrainer.PARAM_LANGUAGE, "pt"));

}

Проблема в том, что, хотя он открыл несколько аннотированных файлов, был обучен только один файл.

0 ответов

Читатель открывает все файлы и отправляет их по одному тренеру. Тренер учится на всех и выдает единую модель вывода. Вот почему вы видите только один выходной файл.

Если вы хотите создать одну модель для каждого входного файла, вам придется создать цикл, который передает файлы один за другим в считыватель.

Другие вопросы по тегам