Как настроить Apache Tika с помощью Apache Solr 1.4.1

Я хочу проиндексировать большое количество PDF-документов.

Я нашел ссылку, показывающую, что это можно сделать с помощью Apache Tika, но, к сожалению, я не могу найти ссылку, которая описывает, как я могу настроить Apache Tika в Solr 1.4.1.

После того, как я настроил, я настроил его, как я могу отправлять документы в Solr напрямую, без использования curl?

Я использую solrnet для индексации.

2 ответа

Решение

Поддержка ExtractingRequestHandler в SolrNet еще не завершена. Вы можете либо завершить его реализацию, либо обойти его и создать свои собственные запросы HttpWeb.

Другие вопросы по тегам