Инвертированный индекс в поисковой системе
Я пытаюсь написать код, чтобы сделать небольшое приложение для поиска текста из файлов.
Файлы должны быть просканированы, и мне нужно поставить инвертированный индекс для ускорения поиска.
Моя проблема в том, что у меня вроде есть идеи о том, каким будет парсер; Я готов ввести в запросе И, НЕ, ИЛИ.
Принимая во внимание, что я не мог понять, каким должен быть мой индекс... Я никогда не создавал инвертированный индекс, поэтому, если кто-нибудь мог бы предложить реальный способ сделать это, я был бы очень благодарен. Теоретически я знаю, как это работает, но моя проблема в том, что я абсолютно не знаю, как это сделать в MySql. Мне также нужно дать вес индексируемым ключевым словам.
2 ответа
Вот простая реализация. http://rosettacode.org/wiki/Inverted_Index
Выбор 1: Apache Solr/Lucene. Вариант 2: поддержка полнотекстового индекса mysql.