Как связать Службу преобразования документов с Watson Retrieval and Ranking
У меня есть 100 документов в формате PDF. Я использовал службу преобразования документов Watson для преобразования документов в формате PDF в единицы ответов JSON. Теперь мне нужно обучить эти документы.
Я написал код на языке Python, для которого требуются единицы ответов JSON и показатель релевантности документов в качестве входных данных для Watson R и R. Как ссылаться на единицы ответов JSON через код Python или Как загрузить единицы ответов JSON из Службы преобразования документов через API-интерфейс Python
1 ответ
Я думаю, вы можете увидеть этот пример от IBM Developers (Node SDK). В этой строке показан один пример для ссылок на единицы JSON Answer.
Язык программирования другой, но вы можете использовать ту же логику, чтобы делать то, что вы хотите, пример интеграции преобразования документов показывает, как преобразовать документ в единицы ответа с помощью службы преобразования документов и загрузить его в службу получения и ранжирования, чтобы сделать Единицы ответа для поиска.
Создайте кластер Solr, загрузите конфигурацию Solr и создайте коллекцию
1.1 В файлах retrieve_and_ran_lifecycle.v1.js и retrieve_and_rank_solr.v1.js вы найдете примеры функций для выполнения этих шагов.
1.2 ВАЖНО: при загрузке конфигурации solr используйте [answer_unit_config.zip] из папки ресурсов, которая включает в себя schema.xml, который определяет поля, которые будут проиндексированы.
Отредактируйте файл document_conversion_integration.v1.js и введите следующее:
2.1 учетные данные службы для преобразования документов и службы получения и ранжирования (каждый экземпляр службы имеет свой набор учетных данных)
2.2 clusterId (получается при создании кластера)
2.3 collectionName и inputDocument, если вы используете значение, отличное от значения по умолчанию
- Запустите следующую команду:
node document_conversion_integration.v1.js