Как получить частоту слова с Solr после фильтрации слова

Я получил результат о частоте слова с использованием фасета в Solrj, но в списке результатов есть слово, которое я не хочу или хочу пропустить, чтобы сосчитать из документа.

Например, в документе

word1 word2 word3 word4 word1 word2 word3

результат будет

word1 : 2
word2 : 2       
word3 : 1

как выше. я хочу получить результат как

word1 : 2
word2 : 2   --> dont need to count.....i want to skip it
word3 : 1

У меня есть список слов, который я хочу пропустить при подсчете слов. Пожалуйста, помогите мне с этим

1 ответ

Вероятно, проще пропустить его в коде переднего плана, чем в Solr - если только вы не можете переиндексировать каждый раз, когда список изменяется.

Если вы просто собираетесь индексировать один раз (или можете переиндексировать при изменении списка), создайте поле самостоятельно и с помощью фильтра стоп-слов удалите термины, которые вам не нужны, в определенном поле. Проблема этого подхода заключается в том, что содержимое, уже находящееся в индексе, не изменится при обновлении фильтра.

Другие вопросы по тегам