Инвертированный индекс в поисковой системе

Я пытаюсь написать код, чтобы сделать небольшое приложение для поиска текста из файлов.

Файлы должны быть просканированы, и мне нужно поставить инвертированный индекс для ускорения поиска.

Моя проблема в том, что у меня вроде есть идеи о том, каким будет парсер; Я готов ввести в запросе И, НЕ, ИЛИ.

Принимая во внимание, что я не мог понять, каким должен быть мой индекс... Я никогда не создавал инвертированный индекс, поэтому, если кто-нибудь мог бы предложить реальный способ сделать это, я был бы очень благодарен. Теоретически я знаю, как это работает, но моя проблема в том, что я абсолютно не знаю, как это сделать в MySql. Мне также нужно дать вес индексируемым ключевым словам.

2 ответа

Вот простая реализация. http://rosettacode.org/wiki/Inverted_Index

Выбор 1: Apache Solr/Lucene. Вариант 2: поддержка полнотекстового индекса mysql.

Другие вопросы по тегам