UIMA RUTA: Курсив
Кто-нибудь знает, как я могу найти все слова в тексте, которые выделены курсивом? И чтобы расширить это, ищите определенные слова, которые (или не) выделены курсивом?
Например, учитывая "я уверен, что я не ошибаюсь", я хотел бы извлечь certain
или извлеките все am
Это не курсивом?
1 ответ
Решение
Предполагая, что информация о форматировании присутствует в CAS, например, путем применения HtmlAnnotator (в сочетании с HtmlConverter), предоставленного Ruta, правила могут выглядеть (как указано в комментарии к вопросу):
I{-> MyType};
SW.ct=="am"{-PARTOF(I) -> MyType};
Возможно, вам нужно импортировать HtmlTypeSystem из Рута.
ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Я разработчик UIMA Ruta