Импорт ранее аннотированного документа в IBM Knowledge Studio

Я делаю некоторые исследования по созданию пользовательских моделей для извлечения сущностей. Для этого я использовал некоторые общедоступные наборы данных и хотел посмотреть, как они работают в IBM Knowledge Studio. Но мне трудно найти способ загрузить общедоступный набор данных (который уже аннотирован) в Студию знаний.

В документе говорится, что ранее аннотированные документы можно импортировать, но в нем не указан формат https://console.bluemix.net/docs/services/watson-knowledge-studio/create-project.html

Документ также говорит, что это может быть из механизма анализа UIMA, я не нахожу хороших примеров, которые показывают формат файла

Кто-нибудь может помочь в этом?

1 ответ

Watson Knowledge Studio может обрабатывать файлы XMI, которые экспортируются из Watson Explorer Content Analytics, Content Analytics Studio или Apache UIMA. Вы можете найти некоторую информацию в документе ниже.

https://console.bluemix.net/docs/services/watson-knowledge-studio/preannotation.html

Надеюсь, это поможет другим.

Когда вы пытаетесь импортировать существующие аннотированные данные в Knowledge Studio, нет четкой документации по формату ввода.

Мы решили обойти эту проблему, вручную добавив аннотации к нескольким файлам из Knowledge Studio и экспортировав эти данные. Мы провели анализ этих экспортированных данных и написали специальные программы, которые преобразуют существующий аннотированный текст в формат, который принимает Knowledge Studio.

Затем импортировал эти данные обратно в Студию знаний.

Другие вопросы по тегам