Solr предлагает вернуть условия из удаленных документов
У меня есть настройка SolrCloud, и я тестирую компонент предложения. У меня есть несколько сотен документов в индексе. Я не хотел, чтобы некоторые документы в индексе содержали тарабарщину (это были двоичные файлы, которые были неправильно преобразованы в текст). Я удалил их из указателя, но в предложениях по-прежнему появляются бессмысленные слова из них.
Моя предлагаемая конфигурация выглядит следующим образом:
<searchComponent name="suggest" class="solr.SuggestComponent">
<lst name="suggester">
<str name="name">fuzzySuggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str>
<str name="dictionaryImpl">HighFrequencyDictionaryFactory</str>
<str name="storeDir">suggester_fuzzy_dir</str>
<str name="field">dictionary_text</str>
<str name="suggestAnalyzerFieldType">phrase_suggest</str>
<str name="exactMatchFirst">true</str>
<float name="threshold">0.001</float>
<str name="buildOnStartup">false</str>
<str name="buildOnCommit">true</str>
</lst>
</searchComponent>
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="suggest">true</str>
<str name="suggest.dictionary">fuzzySuggester</str>
<str name="suggest.onlyMorePopular">true</str>
<str name="suggest.count">5</str>
<str name="suggest.collate">true</str>
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
Обратите внимание, что buildOnCommit
установлен в true
, Я также пытался удалить их с помощью /suggest
запрос с suggest.build=true
параметр, но это не имело никакого эффекта.
Есть ли что-то еще, чтобы удалить термины из словаря?
1 ответ
Несмотря на использование expungeDeletes=true
в обновлении все еще оставались удаленные документы. Оптимизация удалила их и, похоже, удалила все бессмысленные термины из предложений.