Как / вы должны использовать библиотеки DKPro с UIMA Ruta?
Я изучил проект UIMA Ruta Workbench Eclipse по умолчанию достаточно, чтобы понять его движущиеся части - например, почему input/
а также output/
папки ведут себя так, как они делают, как выполнить проект, используя jcasgen
и другие плагины Maven и т. д.
Но даже после нескольких часов изучения проекта и игры с Maven, чтобы попытаться заставить его работать, у меня все еще есть много проблем, делая что-то очень простое: использование DKPro
библиотеки (особенно типы) из Ruta
скрипт.
Мой фундаментальный вопрос заключается в следующем: каков путь наименьшего сопротивления к использованию типов и компонентов анализа из библиотек DKPro и TC в скрипте Ruta?
Мои конкретные вопросы:
Я заметил, что в
desc/type
папка многихapi
банки естьTypeSystemDescription
XML-файлы, подходящие для использования с Ruta. Есть ли способ получить "мастера"TypeSystemDescription
XML-файл дляDKPro
компоненты?Есть ли проект значительной сложности, который использует оба
Ruta
а такжеDKPro
что я могу учиться?В чем разница между
AnalysisEngine
как в том, что вы делаете сRuta
сценарии иAnalysis Component
ты пишешь на яве?
Отредактировано, чтобы отразить меньше разочарования
1 ответ
На самом деле, люди из Рута и DKPro вместе проводят мастер-классы и после этого счастливо сидят у костра - или, по крайней мере, в коктейль-баре и выпивают. К сожалению, мы не часто занимаемся этим.
Вид и количество вопросов, которые вы задаете, требуют обучения;)
Вы посмотрели слайды и примеры из нашего совместного семинара на GSCL 2013?
Он включает в себя несколько примеров того, как использовать DKPro Core и Ruta вместе. В этих примерах есть проект Maven, отвечающий за выборку зависимостей DKPro Core, и отдельные проекты Ruta затем зависят от этого проекта Maven и используют механизмы анализа.
Он также должен работать, чтобы иметь единый проект с природой Рута и Мейвен.
Способ получить дескриптор одного типа для всех типов DKPro Core в вашем пути к классам (или, вернее, для всех типов с поддержкой uimaFIT в вашем пути к классам)
import org.apache.uima.fit.factory.TypeSystemDescriptionFactory; OutputStream os = ... TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os);
Посмотрите учебные примеры GSCL 2013.
AnalysisComponent
представляет вид изнутри, то есть с точки зрения разработчика компонентов (вид изнутри фреймворка).AnalysisEngine
представляет вид снаружи, то есть от пользователя компонента / рабочего процесса. Тем не менее, как правило, можно сказать "я внедряю новый механизм анализа" и имею в виду "я собираюсь подклассJCasAnnotator_ImplBase
(реализацияAnalysisComponent
)". Смотрите также этот пост в списке рассылки разработчиков UIMA.
Раскрытие информации: я разработчик DKPro Core и разработчик Apache UIMA.