Импорт ранее аннотированного документа в IBM Knowledge Studio
Я делаю некоторые исследования по созданию пользовательских моделей для извлечения сущностей. Для этого я использовал некоторые общедоступные наборы данных и хотел посмотреть, как они работают в IBM Knowledge Studio. Но мне трудно найти способ загрузить общедоступный набор данных (который уже аннотирован) в Студию знаний.
В документе говорится, что ранее аннотированные документы можно импортировать, но в нем не указан формат https://console.bluemix.net/docs/services/watson-knowledge-studio/create-project.html
Документ также говорит, что это может быть из механизма анализа UIMA, я не нахожу хороших примеров, которые показывают формат файла
Кто-нибудь может помочь в этом?
1 ответ
Watson Knowledge Studio может обрабатывать файлы XMI, которые экспортируются из Watson Explorer Content Analytics, Content Analytics Studio или Apache UIMA. Вы можете найти некоторую информацию в документе ниже.
https://console.bluemix.net/docs/services/watson-knowledge-studio/preannotation.html
Надеюсь, это поможет другим.
Когда вы пытаетесь импортировать существующие аннотированные данные в Knowledge Studio, нет четкой документации по формату ввода.
Мы решили обойти эту проблему, вручную добавив аннотации к нескольким файлам из Knowledge Studio и экспортировав эти данные. Мы провели анализ этих экспортированных данных и написали специальные программы, которые преобразуют существующий аннотированный текст в формат, который принимает Knowledge Studio.
Затем импортировал эти данные обратно в Студию знаний.