Какой дамп быстрее всего импортировать в виртуоз с открытым исходным кодом - n3/nt/xml?
Я импортирую некоторые дампы RDF в редакцию Virtuoso Open Source (6.x). Мне было интересно, если есть разница в производительности между импортом различных сериализаций одних и тех же данных (у меня есть NT/N3/XML доступны).
Пока я в этом: кто-нибудь видел различия в производительности импорта при использовании чередования на одном диске?
1 ответ
Вопросы, касающиеся, в частности, Virtuoso, обычно лучше всего поднимать на общедоступных дискуссионных форумах OpenLink, в списке рассылки Virtuoso Users или в конфиденциальном разделе поддержки.
Тем не менее, будет существовать некоторая разница в производительности при импорте, которая станет более очевидной по мере увеличения размера нагрузки.
RDF / XML почти всегда будет относительно медленным - потому что все дерево XML должно быть проанализировано перед тем, как любые триады могут быть записаны в хранилище графиков.
NT оставляет большую часть синтаксического сахара, который должен обрабатываться в N3, поэтому NT, вероятно, будет самым быстрым для загрузки. Тем не менее, файлы N3, как правило, будут меньше (иногда значительно), чем NT того же набора данных, и в некоторых случаях это может быть важным фактором...
Итог - этот вопрос полон нюансов, и нет универсально верного ответа.
Каждый пост здесь должен охватывать только один вопрос, но я также скажу - чередование обычно не приносит большой пользы на одном устройстве (будь то HDD или SSD). Эта функция обеспечивает большую производительность при разделении хранилища на несколько устройств, каждое на своем контроллере и т. Д.