Lucene - лемматизация поиска по умолчанию

Есть ли Lucene поиск по умолчанию сделать лемматизацию /stemming на слова?

Например, при использовании кода в этом примере слова в документах используются как есть или они преобразуются в их базовую форму (например, Managing -> manag), и если да, то какой лемматизатор по умолчанию он использует?

1 ответ

Решение

Образец, упомянутый в вашем посте, использует Lucene StandardAnalyzer, который не использует stemming.

Если вы хотите использовать stemming, вам нужно использовать другую реализацию Analyzer, например: SnowballAnalyzer

Другие вопросы по тегам