UIMA RUTA: Курсив

Кто-нибудь знает, как я могу найти все слова в тексте, которые выделены курсивом? И чтобы расширить это, ищите определенные слова, которые (или не) выделены курсивом?

Например, учитывая "я уверен, что я не ошибаюсь", я хотел бы извлечь certainили извлеките все amЭто не курсивом?

1 ответ

Решение

Предполагая, что информация о форматировании присутствует в CAS, например, путем применения HtmlAnnotator (в сочетании с HtmlConverter), предоставленного Ruta, правила могут выглядеть (как указано в комментарии к вопросу):

I{-> MyType};
SW.ct=="am"{-PARTOF(I) -> MyType};

Возможно, вам нужно импортировать HtmlTypeSystem из Рута.

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Я разработчик UIMA Ruta

Другие вопросы по тегам