Как получить частоту слова с Solr после фильтрации слова
Я получил результат о частоте слова с использованием фасета в Solrj, но в списке результатов есть слово, которое я не хочу или хочу пропустить, чтобы сосчитать из документа.
Например, в документе
word1 word2 word3 word4 word1 word2 word3
результат будет
word1 : 2
word2 : 2
word3 : 1
как выше. я хочу получить результат как
word1 : 2
word2 : 2 --> dont need to count.....i want to skip it
word3 : 1
У меня есть список слов, который я хочу пропустить при подсчете слов. Пожалуйста, помогите мне с этим
1 ответ
Вероятно, проще пропустить его в коде переднего плана, чем в Solr - если только вы не можете переиндексировать каждый раз, когда список изменяется.
Если вы просто собираетесь индексировать один раз (или можете переиндексировать при изменении списка), создайте поле самостоятельно и с помощью фильтра стоп-слов удалите термины, которые вам не нужны, в определенном поле. Проблема этого подхода заключается в том, что содержимое, уже находящееся в индексе, не изменится при обновлении фильтра.