Какая реализация SPARQL (triplestore) идеальна для производительности чтения?
Я новичок в RDf и ищу базу данных RDF с открытым исходным кодом, которая имеет отличную производительность чтения. Было бы около 10 миллиардов триплетов и более 100 запросов SPARQL в секунду. Сейчас мне не нужно читать и писать в базу данных одновременно.
Я видел базы данных в википедии ( http://en.wikipedia.org/wiki/SPARQL), но мне хотелось бы получить совет специалиста по самой проверенной временем системе. У него должна быть лицензия Apache или такая же разрешительная лицензия.
1 ответ
Jena и Sesame, вероятно, являются единственными базами данных, которые соответствуют вашим критериям лицензирования, но ни одна из них не будет масштабироваться до нужного вам размера. Джена с TDB может, но я не уверен, как будет выглядеть производительность в таком масштабе. Урожай Сезам, конечно, не предназначен для такого масштаба.
Существуют и другие базы данных с открытым исходным кодом, но они имеют лицензию GPL, например 4store, которая может соответствовать вашим критериям производительности. Но лучше всего использовать коммерческую базу данных (у большинства есть бесплатные ознакомительные версии); это лучший способ получить желаемую шкалу и пропускную способность. Но это означает, что вам, возможно, придется платить кому-то за их тяжелую работу, облом, я знаю.