Ошибка загрузки DBPedia Turtle в Virtuoso с помощью Docker
Я скачал файлы черепах DBPedia с их структурой извлечения ( https://github.com/dbpedia/extraction-framework).
Тогда я использовал образ докера tenforce/virtuoso:1.3.2-virtuoso7.2.2
после извлечения всех ttl.bz2
к toLoad
папка.
После полной загрузки я проверил isql
с select * from DB.DBA.LOAD_LIST;
и получил ошибку в одном из файлов:
2 2019.2.2 11: 31.43 69876000 2019.2.2 11: 31.44 521623000 0 NULL 37000 [Векторизованный загрузчик Turtle] SP029: Загрузчик TURTLE RDF, строка 172395: синтаксическая ошибка
Конечная точка виртуоза ( http://localhost:8890/sparql) находится в сети, но запросы не возвращают правильные результаты.
Знаете ли вы, что я могу сделать, чтобы исправить эту ошибку?
ОБНОВЛЕНИЕ: новее tenforce/virtuoso:1.3.2-virtuoso7.2.5.1
а также openlink/virtuoso-opensource-7
были также проверены, давая тот же результат.
ОБНОВЛЕНИЕ 2: строка 172395 этого файла выглядит нормально: <http://pt.dbpedia.org/resource/Reino_de_Roma> <http://dbpedia.org/ontology/governmentType> <http://pt.dbpedia.org/resource/Monarquia> <http://pt.wikipedia.org/wiki/Reino_de_Roma?oldid=53119289&ns=0> .
1 ответ
Как я сказал в вашем двойном посте на github -
Я бы начал с использования
tenforce/virtuoso:latest
или жеtenforce/virtuoso:virtuoso7.2.5
или жеtenforce/virtuoso:1.3.2-virtuoso7.2.5
Все из которых должны быть основаны на Virtuoso 7.2.5.1 (с августа 2018 года), а не довольно пожилыеtenforce/virtuoso:1.3.2-virtuoso7.2.2
которая основана на аналогично пожилой виртуоз 7.2.2 (с декабря 2015 года).