Сфинкс + Токийский Тиран + MySQL
Я смотрю на создание полнотекстовой поисковой системы для одного из моих проектов. У нас есть Mysql, Tokyo Tyrant и файлы документов, которые нужно проиндексировать.
Я сейчас смотрю на Сфинкса, но не могу понять, смогу ли я использовать его для индексации каждого документа.
Я знаю, что можно разрешить Sphinx использовать Mysql, но я ищу способ разрешить Sphinx индексировать и запрашивать токийского тирана, а также документы индексного файла.
Это может быть Sphinx или Xapian или другой, но не JAVA (Lucene отсутствует), но что-то, что можно использовать с PHP и запускать в Linux.
Любая идея поисковой системы, которая может принять больше, чем Mysql в качестве источника?
Спасибо
2 ответа
Вы можете отправлять данные из любого источника в sphinx, используя xmlpipe2
Вам просто нужно написать некоторый код (возможно, на PHP) для чтения из Tokyo Tyrant (не уверен, что это такое, так что вы сами там) и файловую систему и упаковать все это в XML. Затем вы просто настраиваете свой источник sphinx для запуска команды, которая выполняет ваш пользовательский код, а sphinx позаботится обо всем остальном.
Если у вас не слишком много документов, и вы хотите использовать только PHP, вы должны взглянуть на Zend_Search_Lucene
:
Zend_Search_Lucene - это механизм текстового поиска общего назначения, полностью написанный на PHP 5. Поскольку он хранит свой индекс в файловой системе и не требует сервера базы данных, он может добавить возможности поиска практически на любой веб-сайт, управляемый PHP.
Тем не менее, если вы используете свой собственный сервер, вы, вероятно, можете установить программное обеспечение, что означает, что вы можете развернуть Lucence/SolR Sphinx, даже если они написаны не только на PHP- это может быть более безопасным решением, если вам нужно индексировать много контента.