Как объединять и запрашивать две разные онтологии, такие как schema.org и dbpedia.org

Я новичок в семантической сети. Я собрал RDF отчеты о человеке из dbpedia.org а также schema.org; Я имею в виду две разные онтологии. Сохранено в одном файле. Теперь я должен запросить их, чтобы отобразить домашнюю страницу (HTML) для этого человека. У меня есть вопрос относительно того, как мы запрашиваем две разные онтологии или как мы объединяем их; пожалуйста, дайте мне идею, как начать. Я использую Apache Jena.

1 ответ

В вашем случае трудной задачей является объединение двух файлов, содержащих онтологии RDF. После их объединения вы можете запросить их так же, как и один файл.

Простое объединение: N-Triples & N-Quads

Если у вас есть два файла данных RDF в формате, подобном черепахе (т. Е. Turtle, TriG, N-Quads или N-Triples), и хотя бы один из них не содержит пустых узлов, то вы можете просто объединить эти два файла в новый файл N-Quads или N-Triples.

Сложность слияния 1: пустые узлы

Если оба файла содержат пустые узлы, то сначала необходимо стандартизировать их отдельно в соответствии с семантикой RDF 1.1. Например, если у вас есть два N-Triple файла, тогда пустое имя узла _:1 может встречаться в обоих файлах, обозначая разные пустые узлы.

Усложнение слияния 2. Формат сериализации требует вложенности

Если один из файлов сериализован в древовидном формате (т. Е. RDF/XML, TriX, RDFa или JSON-LD), вы не можете просто объединить файлы и ожидать, что результат будет согласованным. В частности, XML-подобные форматы требуют, чтобы вы включили все данные в открывающий и закрывающий теги, представляющие один корневой узел. Аналогично, JSON-подобные форматы требуют, чтобы вы заключали все данные в открывающие и закрывающие скобки (либо фигурные, либо квадратные скобки). В этих условиях вам необходимо полностью разобрать два файла данных в граф RDF, а затем полностью сериализовать граф в один файл. Задачи синтаксического анализа и сериализации довольно сложны в общем случае, поэтому вы, скорее всего, захотите позволить существующей библиотеке справиться с этим. Вы упоминаете Йену, которая, безусловно, может это сделать. Обратите внимание, что если хотя бы один из файлов содержит именованные графы, вам нужно загрузить + сохранить набор данных RDF вместо графика RDF. Йена, вероятно, поддерживает последнее тоже.

Другие вопросы по тегам