Загрузка большого файла RDF в Сезам
Я пытаюсь создать конечную точку SPARQL на основе Sesame. Я установил Tomcat, PostgreSQL и развернул веб-приложение Sesame. Я создал хранилище на основе хранилища PostgreSQL RDF. Теперь мне нужно загрузить большой репозиторий (540M, размер файла несколько ГБ) в репозиторий. Загрузка большого файла через Workbench не является хорошим решением - это займет несколько дней. Какое лучшее непрограммное решение для загрузки данных? Существуют ли такие инструменты, как "консоль" для загрузки данных? Например, в Virtuoso есть инструмент isql для массовой загрузки...
1 ответ
Мне известно о готовом инструменте массовой загрузки, доступном для Сезама, хотя совместимые с Сезамом поставщики тройного магазина действительно имеют такие инструменты в составе своей конкретной базы данных. Программирование решения для массовой загрузки не является особенно сложным, но мы почему-то не удосужились включить такой инструмент в основной дистрибутив Sesame.
Кстати, 540M утроено, вероятно, слишком велико для любого из хранилищ Sesame по умолчанию - Native Store масштабируется только до 150M, и загрузка такого большого набора данных в хранилище памяти слишком громоздка (даже если у вас была доступная RAM), Поэтому вам, вероятно, нужно изучить использование базы данных, совместимой с Sesame, предоставленной третьей стороной. Доступно много вариантов, как коммерческих, так и бесплатных / с открытым исходным кодом, см. Этот обзор на веб-сайте Sesame для получения списка некоторых предложений.