Управление документами / Управление контентом с поиском

У меня есть требование к системе управления документами для обработки PDF, Word, XLS, PPT с семантическим поиском.

Я начал искать в эластичном поиске то же самое и наткнулся на Apache JacKrabbit и впоследствии на OpenKM а также Hippo, Несмотря на то, что в Jackrabbit существуют основные функции, такие как управление версиями, мне нужно несколько советов о том, как это сделать. Мне нужна помощь в решении следующих проблем:

  • Должен ли я просто использовать elasticsearch а также elasticsearch подключаемый модуль или использование Jackrabbit с бэкэндом MySQL и используйте Elasticsearch для индексации документов.
  • Или я должен использовать OpenKM?

Любые указатели будут с благодарностью. Это, наконец, потребует интеграции приложений.
Обновите логически, используя ElasticSearch Поиск имеет смысл. Но я полагаю, что не могу использовать это в качестве основного источника данных.

  • Каковы лучшие варианты хранения (основной) Apache JackRabbit с MySQL?
  • Поскольку все функции предварительно встроены в OpenKM, это был бы лучший вариант?

1 ответ

Чего ты хочешь достичь? Хотите ли вы сделать доступными документы? Об управлении контентом в документах? ES или любая поисковая система, как правило, не является основным источником данных.

Я не могу дать вам совет относительно OpenKM (ни за, ни против). Состязание Бегемота зависит от вашего случая, о котором мне нужно знать больше.

Другие вопросы по тегам