Использование Zend Lucene для поиска файлов Office 2003 или более старых
Я знаю, что уже есть объекты, поддерживающие файлы Office 2007, но есть ли какая-либо собственная поддержка Office 2003 или более ранней версии?
2 ответа
Решение
Там, кажется, нет ничего в комплекте с Zend_Search_Lucene
, для тех.
Тем не менее, учитывая, что он может индексировать HTML-документы, если вы можете найти способ конвертировать ваши документы Office 2003 в HTML (по крайней мере, для индексации - с сохранением оригинальной версии помимо HTML, для консультации), вы могли бы проиндексировать те...
Я бы порекомендовал индексировать документы вместе с Solr и Tika и использовать JSON для поиска в индексе Solr/Lucene из PHP. Обратитесь к статье ExtractingRequestHandler (Solr wiki page) за дополнительной информацией.