Смонтируйте конечную точку SPARQL для использования с пользовательскими онтологиями и тройными RDF
Я пытался выяснить, как смонтировать конечную точку SPARQL за пару дней, но, насколько я читаю, я не могу этого понять.
Прокомментируйте мое намерение: у меня есть открытый сервер данных, смонтированный на CKAN, и моя цель - иметь возможность использовать SPARQL-запросы к данным. Я знаю, что не мог сделать это непосредственно на самих наборах данных, и мне пришлось бы определить свой собственный OWL и преобразовать данные, которые я хочу использовать, из формата CSV (который является форматом, в котором они находятся в настоящее время) в тройной формат RDF (чтобы используется в качестве связанных данных).
Идея состояла в том, чтобы сначала протестировать метаданные репозиториев, которые могут быть сгенерированы автоматически с расширением ckanext-dcat, но я действительно не могу найти, с чего начать. Я искал информацию о том, как установить сервер Virtuoso для SPARQL, но информация, которую я нашел, оставляет желать лучшего, не говоря уже о том, что я не могу найти нигде объяснения, как я мог бы на самом деле представить свои собственные OWL и RDFs в самом Виртуозе.
Кто-то, кто может мне помочь, чтобы узнать, как начать? Спасибо
1 ответ
Я немного запутался. Может быть, это два или более вопросов?
1. Как преобразовать табличные данные, такие как CSV, в семантический формат RDF?
Это можно сделать с помощью подхода R2RML. Карма является отличным графическим интерфейсом для этой цели. Как вы говорите, подобное преобразование действительно может быть улучшено с помощью базовой онтологии OWL. Но это можно сделать и без создания собственной онтологии.
Я подробно остановился на этом в ответе на другой вопрос.
2. Теперь, когда у меня есть данные в формате RDF, как я могу предоставить их с помощью конечной точки SPARQL?
Виртуоз - это разумный выбор. Существует несколько способов его развертывания и несколько способов загрузки данных, и, следовательно, множество учебников по данной теме. Вот один хороший, из DBpedia.
Если вам нужен более простой путь к запуску тройного хранилища RDF с конечной точкой SPARQL, Stardog и Blazegraph доступны в виде JAR, а RDF4J можно легко развернуть в контейнере, таком как Tomcat.
Все они предоставляют веб-графические интерфейсы для загрузки данных и выполнения запросов, в дополнение к конечным точкам SPARQL REST. По крайней мере, Stardog также предоставляет инструменты командной строки для массовой загрузки.