Почему SOLR KStemFilterFactory не связывает слово "карты" с "картой"?

Я использую KStem Filter Factory(KStemFF) в SOLR. Я понял, что KStemFF не на 100% точен.

Например, это не означает, что слово "карты" означает "карта".

"Звуковые карты" и "Звуковые карты" дают разные результаты.

Есть ли способ заставить это работать, используя только KStemFF? Я понял, что использование других стеммеров, таких как porter-stemmer, может помочь в этом случае, но я действительно не хочу использовать несколько стеммеров в проекте.

1 ответ

Решение

KStem менее агрессивен, чем PorterStem, в терминах слов, и, следовательно, может пропустить преобразование некоторых множественных чисел на основании правил, которые он имеет. Вы можете сравнить несколько стеммеров, основываясь на производительности и результатах, прежде чем сделать выбор. Ни один стеммер не обеспечит вам 100% точности и желаемых результатов, он должен быть САМЫМ ПОДХОДЯЩИМ на основе ваших результатов.

Другие вопросы по тегам