Lucene.net Поиск нечетких фраз

Я пробовал это сам в течение значительного периода и искал повсюду в сети - но не смог найти ЛЮБЫХ примеров поиска нечетких фраз через Lucene.NET 2.9.2. ( C#)

Может ли кто-нибудь посоветовать, как сделать это подробно, и / или предоставить пример кода - я бы всерьез оценил бы любую помощь, потому что я полностью застрял?

1 ответ

Я предполагаю, что у вас работает Lucene и создан поисковый индекс с некоторыми полями в нем. Итак, давайте предположим, что:

var fields = ... // a string[] of the field names you wish to search in
var version = Version.LUCENE_29; // your Lucene version
var queryString = "some string to search for";

Когда у вас есть все это, вы можете определить поисковый запрос для нескольких полей, например так:

var analyzer = LuceneIndexProvider.CreateAnalyzer();
var query = new MultiFieldQueryParser(version, fields, analyzer).Parse(queryString);

Возможно, вы уже зашли так далеко, и вам не хватает только нечеткой части. Я просто добавляю тильду ~ каждому слову в queryString чтобы сказать Lucene сделать нечеткий поиск всех слов в queryString:

if (fuzzy && !string.IsNullOrEmpty(queryString)) {
    // first escape the queryString so that e.g. ~ will be escaped
    queryString = QueryParser.Escape(queryString);
    // now split, add ~ and join the queryString back together
    queryString = string.Join("~ ",
        queryString.Split(' ', StringSplitOptions.RemoveEmptyEntries)) + "~";
    // now queryString will be "some~ string~ to~ search~ for~"
}

Ключевым моментом здесь является то, что Lucene использует нечеткий поиск только для терминов, которые заканчиваются ~, Это и некоторая полезная информация была найдена на http://scatteredcode.wordpress.com/2011/05/26/performing-a-fuzzy-search-with-multiple-terms-through-multiple-lucene-net-document-fields/.

Другие вопросы по тегам