UIMA (Архитектура управления неструктурированной информацией) - это архитектура для создания масштабируемых приложений, которые анализируют и извлекают информацию из источников неструктурированных данных, таких как текст, аудио и видео. Apache UIMA - это среда Java с открытым исходным кодом, реализующая архитектуру UIMA. Приложения UIMA обычно используют методы обработки естественного языка (NLP) для выполнения анализа.
1 ответ

UIMA Ruta Только комментирует самый длинный матч

Я использую RUTA и написал много разных правил для извлечения одной и той же сущности. Например, я буду добывать "фабрику туалетной бумаги". На данный момент мои правила приведут к фабрике туалетной бумаги, бумажной фабрике и фабрике. Но меня интере…
14 ноя '16 в 13:22
1 ответ

Сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)

Я хочу выбрать инструмент для обработки естественного языка для выполнения общих задач, таких как токенизация, обнаружение предложений, различные теги (распознавание имен, POS-теги, ...). мой вопрос состоит из двух частей: Каковы критерии выбора инс…
18 сен '13 в 09:13
1 ответ

Сколько языков поддерживает UIMA Ruta?

Я новичок в области анализа текста, технологий UIMA и UIMA Ruta и работаю над новым программным обеспечением (на основе Java) для интеллектуальной обработки документов. В настоящее время я просматриваю все материалы для чтения, связанные с UIMA/Ruta…
24 апр '16 в 03:49
0 ответов

Необходимо аннотировать слово без использования "регулярного выражения"

Необходимо аннотировать / сопоставить слово (глава). Слово Глава встречается дважды в приведенном ниже примере вводимого текста. DECLARE Chapter; W{REGEXP("Chapter",true),-PARTOF(Chapter)-> MARK(Chapter)}; Когда я использовал условие Regexp, оно …
17 окт '17 в 06:12
0 ответов

Автозаполнение для UIMA Ruta в Eclipse

Есть ли способ иметь функцию автозаполнения при кодировании в UIMA Ruta на Eclipse? Например, когда я печатаю FEAЯ мог бы получить предложение, как FEATURE("",""), Версия Eclipse, которую я использую, - это Mars 2, а для UIMA: Инструменты UIMA (со с…
23 окт '17 в 09:27
0 ответов

Исключение при интеграции UIMA с Solr

Я пытаюсь интегрировать UIMA с Solr. Я создал файл pear (упакован и установлен)- opennlp.uima.OpenNlpTextAnalyzer_pear.xml Я использую аннотаторы openNLP-UIMA для анализа документов. Файл pear(xml) находится по моему системному пути:D:\temp\opennlp.…
26 мар '17 в 14:37
1 ответ

UIMA/dkpro: получить тип соединения

Я использую UIMA в сочетании с UIMAfit и dkpro и StanfordParser для разбора английских предложений. Я могу построить деревья зависимостей без проблем. Для "и"/"или" союзов я получаю аннотацию с классом CONJ, который является подклассом Dependency, Н…
20 июл '15 в 11:00
1 ответ

Слово несоответствия Уима Рута

Имитация HyphenizationWord Как в автономном режиме,New-list,VBSE-in..etc с помощью (SW|CW|CAP) HYPHEN (SW|CW|CAP) HYPHEN (SW|CW|CAP) {-PARTOF(HyphenizationWord) ->MARK(ThreeHyphenizationWord,1,5)}; (SW|CW|CAP) HYPHEN (SW|CW|CAP) {-PARTOF(Hypheniz…
24 авг '16 в 13:06
1 ответ

Доступ к объединенным аннотациям UIMA Ruta в Java

У меня проблема с доступом к объединенным аннотациям рута. Мои аннотации основаны на предыдущем модуле, который генерирует NormalizedNamedEnitites (NNE) и помечает их в соответствии с набором правил, который работает просто отлично: NormalizedNamedE…
04 июл '18 в 09:32
1 ответ

UIMA Ruta Создание аннотации с элементами, разделенными некоторым текстом

У меня есть текст с аннотациями, созданными следующим образом: wewf.werwfwef. wewfwefwwew. wefewefwff AnnotationA asdfawece aefae eafewfaefa aefafe ceaewfae adfcaecae acaeaet aegaegageg caeacdaefa AnnotationB sadaeceaee aef aewfaegg rresf ceeaefaeae…
07 июл '14 в 08:05
1 ответ

Как вы связываете UIMA с SOLR Dataimporthandler?

Мы проводили некоторые тесты с Apache UIMA. Результаты потрясающие! Нашей идеальной настройкой была бы тесная интеграция UIMA с SOLR. В идеале нам нравится передавать весь контент, который мы индексируем, за UIMA, для дополнительных метаданных. Дост…
28 сен '11 в 11:51
1 ответ

Пометка Маркфаст

Я использую Markfast как показано ниже Авторсценария: WORDLIST PARTICLESLIST = 'NameswithParticles.txt'; DECLARE PARTICLES; Document{ -> MARKFAST(PARTICLES, PARTICLESLIST,true)}; NameswithParticles.txt: der Der de De d' D' De la de La de la von V…
01 ноя '16 в 07:49
1 ответ

Fuziness In UIMA рута

Есть ли вариант нечеткости в случае совпадения слов или игнорирования некоторых особых случаев. Например: STRINGLIST AMIMALLIST = {"LION","TIGER","MONKEY"}; DECLARE ANIMAL; Document {-> MARKFAST(ANIMAL, AMIMALLIST, true)}; Мне нужно сопоставить с…
16 авг '17 в 08:19
1 ответ

Есть ли способ получить список аннотаций из Apache UIMA вместо использования CAS GUI?

В настоящее время я использую Apache UIMA для получения списка вхождений терминов фенотипа. Однако документация (почему столь многим API-интерфейсам программного обеспечения для биоинформатики не хватает хорошей документации!), Похоже, указывает тол…
18 фев '15 в 15:59
1 ответ

UIMA Ruta: необязательный квантификатор

Я хочу соответствовать некоторым условиям, только если термин, стоящий за этим термином, важен для меня. Итак, я создал минимальный пример: Это мои данные испытаний: small Large Large small И я хочу отметить термины " маленький" и " большой", но не …
09 ноя '16 в 20:20
0 ответов

UIMA Ruta: невозможно игнорировать периоды, используя MarkTable

Если у меня есть словарь, содержащий различные аббревиатуры и обозначения, в идеале я бы хотел избежать записи для каждого "США", "США" и "США". У меня нет проблем с игнорированием case, но аргумент ignore chars, похоже, не работает по всем направле…
29 окт '14 в 12:31
1 ответ

Проблема со сборкой WordTables в UIMA RUTA / RETAINTYPE не работает

Я пытаюсь комментировать документ с помощью RUTA, но не все термины в моем словаре увольняют. Похоже, что таблицы слов могут не читаться правильно или что RETAINTYPE(SPACE)/RETAINTYPE(WS) не работает. Пример: у меня есть термины "открыть шкаф", "отк…
31 авг '18 в 16:58
1 ответ

UIMA RUTA: Курсив

Кто-нибудь знает, как я могу найти все слова в тексте, которые выделены курсивом? И чтобы расширить это, ищите определенные слова, которые (или не) выделены курсивом? Например, учитывая "я уверен, что я не ошибаюсь", я хотел бы извлечь certainили из…
16 июн '17 в 10:24
0 ответов

Какая стратегия сериализации доступна в удаленной АЕ-связи UIMA-AS?

Согласно ссылке ниже https://uima.apache.org/d/uima-as-2.10.3/uima_async_scaleout.html UIMA-AS допускает только двоичную сериализацию или сериализацию XMI. Я считаю, что XMI не эффективен, и бинарный не работает для удаленного AE. Есть ли другие дос…
14 ноя '18 в 06:01
1 ответ

Недопустимый дескриптор Исключение - UIMA с JSF и Tomcat 7

Я получаю исключение при запуске приложения UIMA на TOMCAT 7.0. ШАГОВ 1) Создан динамический веб-проект 2) Добавлено "ДОБАВИТЬ UIMA NATURE" 3) Создан механизм примитивного анализа (АЕ). Каждый примитив AE имеет тип аннотации и аннотатор (пример взят…
01 апр '13 в 05:43