Использование Zend Lucene для поиска файлов Office 2003 или более старых

Я знаю, что уже есть объекты, поддерживающие файлы Office 2007, но есть ли какая-либо собственная поддержка Office 2003 или более ранней версии?

2 ответа

Решение

Там, кажется, нет ничего в комплекте с Zend_Search_Lucene, для тех.

Тем не менее, учитывая, что он может индексировать HTML-документы, если вы можете найти способ конвертировать ваши документы Office 2003 в HTML (по крайней мере, для индексации - с сохранением оригинальной версии помимо HTML, для консультации), вы могли бы проиндексировать те...

Я бы порекомендовал индексировать документы вместе с Solr и Tika и использовать JSON для поиска в индексе Solr/Lucene из PHP. Обратитесь к статье ExtractingRequestHandler (Solr wiki page) за дополнительной информацией.

Другие вопросы по тегам