Могу ли я использовать Apache Jena и сохранить онтологию с помощью Apache Solr
У нас есть облачное базовое Java-приложение, которое использует Oracle DB и Apache Solr для индексации / поиска документов. Мне нужно реализовать онтологию, и я собираюсь использовать Apache Jena. Это неизведанная территория для меня. Согласно документации, кажется, что используя TDB, мы можем использовать Oracle DB для хранения / запроса, но мне не ясно, можем ли мы использовать Apache Solr для той же цели. Это возможно? Какие плюсы / минусы? Можете ли вы дать мне краткое сравнение между TDB и Solr в связи с этим?
1 ответ
tl;dr Вы можете сделать это, но это явно не так.
Основной вопрос здесь: можем ли мы хранить онтологические данные в такой же плоскости, как индекс Lucene/Solr. Ну, с достаточным трудом и самоотдачей вы можете сделать это. Я написал хранилище для данных тематических карт на основе Lucene несколько лет назад. Это принесло мне степень магистра в Comp.Sci. Но это не то, что вы хотите, я полагаю.
Расширение Apache Jena TDB - это собственная база данных, разработанная для простого использования в Jena. Насколько я понимаю, для Solr нет такого разъема, который можно было бы использовать в качестве магазина. Если вы настаиваете на использовании Solr в качестве хранилища данных, вам придется: а) серьезно подумать о том, как объединить онтологические данные в таблицы индексов, и б) самостоятельно реализовать соединитель.
Я бы сказал, перейдите с TDB, и если вы хотите сделать поиск текста с Jena, используйте что-то вроде расширения TEXT QUERY.