Apache UIMA Ruta Workbench с пользовательским рута-ядром
В нашем корпусе мы часто находим и должны анализировать буквенно-цифровые данные как один токен (например, хэши файлов, адреса электронной почты и т. Д.). Мы создали нашу собственную версию ruta-core, переработав определение JFlex. Есть ли способ, которым мы все еще можем работать с этой новой версией рута-ядра в Workbench?
1 ответ
Если вы используете простые проекты Ruta, вам необходимо заменить плагин ruta.engine другим jar-файлом, содержащим вашу версию ruta-core. Чистым способом было бы создать полный сайт обновлений с вашей версией.
Вы также можете установить jar-ядро ruta в пути к классам конфигураций запуска ruta.
Если вы используете проекты на основе maven, вы можете установить зависимость для вашей версии ruta-core, которую затем следует использовать в делегате запуска.
Для вашего случая использования я бы вообще не использовал вашу собственную версию ruta-core. Вы можете просто написать свою собственную версию TokenLexer, как вы, вероятно, и сделали. Затем вы можете настроить используемый TokenLexer в RutaEngine, так как есть параметр конфигурации для его настройки. Таким образом, уже есть некоторая функциональность для настройки определения JFlex без создания собственного рута-ядра.
ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Я разработчик UIMA Ruta