Как извлечь несколько аннотаций uima одного и того же типа с помощью Content Analytics Studio

В Watson Explorer Content Analytics Studio я ищу способ создания нескольких аннотаций одного типа, если текст содержит несколько терминов в одном предложении или абзаце. Я не могу пройти мимо одной аннотации, я могу сделать так, чтобы она выделяла все "текстовые контейнеры", но, тем не менее, она создает одну аннотацию. Я пытался "запустить все правила на этом уровне", но это также не дает желаемого результата

Ниже некоторые образцы

Домашнее задание будет в главах 1,2 и 4 книги "Bonjour France"

Пересмотрите пункты 2 и 3 главы 2 книги "Большая история".

Содержание глав с 1 по 3 будет частью теста

На следующей неделе домашнее задание - прочитать страницы 1, 2 и 5 учебника.

У меня пока есть следующие помощники (см. Скриншот)

Ожидаемый результат для первой строки - 3 аннотации типа SinglePieceOfContent со значениями / функциями:

  1. глава 1 книга "Бонжур Франция"
  2. глава 2 книги "Бонжур Франция"
  3. глава 4 книга "Бонжур Франция"

Я хотел бы избежать создания собственного аннотатора, но если это так, я бы хотел, чтобы это подтвердилось.

1 ответ

Два способа сделать это, оба немного неуклюжи и могут не работать с вашими конкретными данными.

Первый способ - вы можете создать несколько аннотаций с одним правилом выбора. Таким образом, грубым способом сделать это является селектор, который выглядит примерно так (высокий уровень, игнорируя промежуточные токены). Сначала выберите максимальное количество комментариев, которые вы собираетесь сделать в одном предложении, скажем 5, затем:

Selection:
find   chapter chapter? chapter? chapter? chapter? book
rule   create 5 annotations, each with limited span over just the N they refer to and add book covered text as a feature to each. 

Второй способ - использовать обновления. Создайте аннотацию, которая идентифицирует каждую из глав и включает в себя строковую книгу функций, для которой установлено значение "по умолчанию". Создайте еще одну аннотацию, которая идентифицирует книгу. Затем создайте агрегатное правило следующим образом:

selection:   chapter*  book
rule:    here just drag the value of book to update the feature value currently set to default. 

На самом деле никаких правил не создано, это обновление. Обновления могут обрабатывать несколько аннотаций одновременно.

Другие вопросы по тегам