Solr 3.6.2 проверка орфографии из нескольких слов фраза: как получить сопоставления без игнорируемых стоп-слов?

У меня проблема с проверкой орфографии Solr 3.6.2 по умолчанию (на основе полей), настроенной с параметрами времени запроса

  • spellcheck.onlyMorePopular = TRUE
  • spellcheck.count = 5
  • spellcheck.collate = верно
  • spellcheck.maxCollations = 5
  • spellcheck.maxCollationTries = 5

на типе поля, в котором есть анализатор solr.StopFilterFactory.

Этап предложения работает как задумано:

  • индексированное поле не содержит стоп-слов
  • нет предложений для данного стоп-слова

Но результирующее сопоставление всегда содержит игнорируемые стоп-слова, которые мне не нужны: я бы предпочел грубое предложение объединенных терминов чему-то, что выглядит как "своего рода" ответ на естественном языке. Например, в поисках "handfum of perries" я бы предпочел "пригоршню ягоды", а не "пригоршню ягоды".

Я не думаю, что стоп-слова, исключенные из предложений по проверке орфографии из-за полевого анализатора запросов, "помечены" для сохранения, как официальная документация относится к другим элементам запроса:

Обратите внимание, что термины без проверки орфографии, такие как термины для запросов диапазона, запросов с префиксами и т. Д., Обнаруживаются и исключаются для проверки орфографии. Такие не проверяемые правописанием термины сохраняются в сопоставленном выводе, так что исходный запрос может быть выполнен снова, как есть.

Кажется, два решения будут

  • либо с пользовательским конвертером запросов, поэтому стоп-слова игнорируются с самого начала: не уверен, что это возможно в 3.6.2
  • или наличие специальной проверки орфографии, которая не будет пытаться найти какое-либо предложение для стоп-слова (или всегда будет предлагать "пустую" строку), без путаницы в процессе сортировки

Я что-то пропустил?

С уважением

0 ответов

Другие вопросы по тегам