Как / вы должны использовать библиотеки DKPro с UIMA Ruta?

Я изучил проект UIMA Ruta Workbench Eclipse по умолчанию достаточно, чтобы понять его движущиеся части - например, почему input/ а также output/ папки ведут себя так, как они делают, как выполнить проект, используя jcasgen и другие плагины Maven и т. д.

Но даже после нескольких часов изучения проекта и игры с Maven, чтобы попытаться заставить его работать, у меня все еще есть много проблем, делая что-то очень простое: использование DKPro библиотеки (особенно типы) из Ruta скрипт.

Мой фундаментальный вопрос заключается в следующем: каков путь наименьшего сопротивления к использованию типов и компонентов анализа из библиотек DKPro и TC в скрипте Ruta?

Мои конкретные вопросы:

  1. Я заметил, что в desc/type папка многих api банки есть TypeSystemDescription XML-файлы, подходящие для использования с Ruta. Есть ли способ получить "мастера" TypeSystemDescription XML-файл для DKPro компоненты?

  2. Есть ли проект значительной сложности, который использует оба Ruta а также DKPro что я могу учиться?

  3. В чем разница между AnalysisEngine как в том, что вы делаете с Ruta сценарии и Analysis Component ты пишешь на яве?

Отредактировано, чтобы отразить меньше разочарования

1 ответ

Решение

На самом деле, люди из Рута и DKPro вместе проводят мастер-классы и после этого счастливо сидят у костра - или, по крайней мере, в коктейль-баре и выпивают. К сожалению, мы не часто занимаемся этим.

Вид и количество вопросов, которые вы задаете, требуют обучения;)

Вы посмотрели слайды и примеры из нашего совместного семинара на GSCL 2013?

Он включает в себя несколько примеров того, как использовать DKPro Core и Ruta вместе. В этих примерах есть проект Maven, отвечающий за выборку зависимостей DKPro Core, и отдельные проекты Ruta затем зависят от этого проекта Maven и используют механизмы анализа.

Он также должен работать, чтобы иметь единый проект с природой Рута и Мейвен.

  1. Способ получить дескриптор одного типа для всех типов DKPro Core в вашем пути к классам (или, вернее, для всех типов с поддержкой uimaFIT в вашем пути к классам)

    import org.apache.uima.fit.factory.TypeSystemDescriptionFactory;
    
    OutputStream os = ...
    TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os);
    
  2. Посмотрите учебные примеры GSCL 2013.

  3. AnalysisComponent представляет вид изнутри, то есть с точки зрения разработчика компонентов (вид изнутри фреймворка). AnalysisEngine представляет вид снаружи, то есть от пользователя компонента / рабочего процесса. Тем не менее, как правило, можно сказать "я внедряю новый механизм анализа" и имею в виду "я собираюсь подкласс JCasAnnotator_ImplBase (реализация AnalysisComponent)". Смотрите также этот пост в списке рассылки разработчиков UIMA.

Раскрытие информации: я разработчик DKPro Core и разработчик Apache UIMA.

Другие вопросы по тегам