Индексирование документов с помощью websolr

Question

Индексирование документов с помощью websolr

Мы собираемся использовать надстройку Websolr для поиска ресурсов в нашем приложении Rails.

Приложение содержит множество моделей ресурсов. Большинство моделей ресурсов являются автономными, с рядом атрибутов: автор, заголовок, набор тегов и т. Д., Однако к некоторым моделям ресурсов прилагается PDF-файл. Нам нужно проиндексировать содержимое этого PDF-файла, чтобы его можно было искать как часть ресурса.

Как мне подойти к этому?

0

ruby-on-rails heroku solr lucene websolr

Источник

user138601 24 фев '13 в 11:25

1 ответ

Решение

Другие вопросы по тегам ruby-on-rails heroku solr lucene websolr

user1333610 24 фев '13 в 15:55 2013-02-24 15:55 · Accepted Answer · 2013-02-24 15:55

Это должно помочь вам начать: https://wiki.apache.org/solr/ExtractingRequestHandler, который интегрирует Tika в Solr.

1

Источник

user1333610 24 фев '13 в 15:55