Lucene - лемматизация поиска по умолчанию
Есть ли Lucene
поиск по умолчанию сделать лемматизацию /stemming на слова?
Например, при использовании кода в этом примере слова в документах используются как есть или они преобразуются в их базовую форму (например, Managing -> manag), и если да, то какой лемматизатор по умолчанию он использует?
1 ответ
Решение
Образец, упомянутый в вашем посте, использует Lucene StandardAnalyzer, который не использует stemming.
Если вы хотите использовать stemming, вам нужно использовать другую реализацию Analyzer, например: SnowballAnalyzer