Как настроить Apache Tika с помощью Apache Solr 1.4.1
Я хочу проиндексировать большое количество PDF-документов.
Я нашел ссылку, показывающую, что это можно сделать с помощью Apache Tika, но, к сожалению, я не могу найти ссылку, которая описывает, как я могу настроить Apache Tika в Solr 1.4.1.
После того, как я настроил, я настроил его, как я могу отправлять документы в Solr напрямую, без использования curl?
Я использую solrnet для индексации.
2 ответа
Решение
Поддержка ExtractingRequestHandler в SolrNet еще не завершена. Вы можете либо завершить его реализацию, либо обойти его и создать свои собственные запросы HttpWeb.