Solr 3.6.2 проверка орфографии из нескольких слов фраза: как получить сопоставления без игнорируемых стоп-слов?
У меня проблема с проверкой орфографии Solr 3.6.2 по умолчанию (на основе полей), настроенной с параметрами времени запроса
- spellcheck.onlyMorePopular = TRUE
- spellcheck.count = 5
- spellcheck.collate = верно
- spellcheck.maxCollations = 5
- spellcheck.maxCollationTries = 5
на типе поля, в котором есть анализатор solr.StopFilterFactory.
Этап предложения работает как задумано:
- индексированное поле не содержит стоп-слов
- нет предложений для данного стоп-слова
Но результирующее сопоставление всегда содержит игнорируемые стоп-слова, которые мне не нужны: я бы предпочел грубое предложение объединенных терминов чему-то, что выглядит как "своего рода" ответ на естественном языке. Например, в поисках "handfum of perries" я бы предпочел "пригоршню ягоды", а не "пригоршню ягоды".
Я не думаю, что стоп-слова, исключенные из предложений по проверке орфографии из-за полевого анализатора запросов, "помечены" для сохранения, как официальная документация относится к другим элементам запроса:
Обратите внимание, что термины без проверки орфографии, такие как термины для запросов диапазона, запросов с префиксами и т. Д., Обнаруживаются и исключаются для проверки орфографии. Такие не проверяемые правописанием термины сохраняются в сопоставленном выводе, так что исходный запрос может быть выполнен снова, как есть.
Кажется, два решения будут
- либо с пользовательским конвертером запросов, поэтому стоп-слова игнорируются с самого начала: не уверен, что это возможно в 3.6.2
- или наличие специальной проверки орфографии, которая не будет пытаться найти какое-либо предложение для стоп-слова (или всегда будет предлагать "пустую" строку), без путаницы в процессе сортировки
Я что-то пропустил?
С уважением