Индексирование PDF документов

Какой лучший способ индексировать документы PDF? Должен ли я индексировать их путем преобразования PDF-документов в TXT или есть лучший способ индексирования PDF-файлов?

1 ответ

Решение

Предполагая, что вы говорите о solr: см. http://wiki.apache.org/solr/ExtractingRequestHandler.

Другие вопросы по тегам