Какая реализация SPARQL (triplestore) идеальна для производительности чтения?

Question

Какая реализация SPARQL (triplestore) идеальна для производительности чтения?

Я новичок в RDf и ищу базу данных RDF с открытым исходным кодом, которая имеет отличную производительность чтения. Было бы около 10 миллиардов триплетов и более 100 запросов SPARQL в секунду. Сейчас мне не нужно читать и писать в базу данных одновременно.

Я видел базы данных в википедии ( http://en.wikipedia.org/wiki/SPARQL), но мне хотелось бы получить совет специалиста по самой проверенной временем системе. У него должна быть лицензия Apache или такая же разрешительная лицензия.

1

sparql rdf triplestore

Источник

user1591730 16 мар '13 в 07:29

1 ответ

Другие вопросы по тегам sparql rdf triplestore

user479610 16 мар '13 в 12:03 2013-03-16 12:03 · Answer 1 · 2013-03-16 12:03

Jena и Sesame, вероятно, являются единственными базами данных, которые соответствуют вашим критериям лицензирования, но ни одна из них не будет масштабироваться до нужного вам размера. Джена с TDB может, но я не уверен, как будет выглядеть производительность в таком масштабе. Урожай Сезам, конечно, не предназначен для такого масштаба.

Существуют и другие базы данных с открытым исходным кодом, но они имеют лицензию GPL, например 4store, которая может соответствовать вашим критериям производительности. Но лучше всего использовать коммерческую базу данных (у большинства есть бесплатные ознакомительные версии); это лучший способ получить желаемую шкалу и пропускную способность. Но это означает, что вам, возможно, придется платить кому-то за их тяжелую работу, облом, я знаю.