Встроенный Porter Stemmer в Java OpenNLP инструментарий

Как есть встроенные в Stemmers, такие как Porter Stemmer в Python NLTK ( /questions/11545467/nuzhen-modul-python-dlya-prohozhdeniya-tekstovyih-dokumentov/11545480#11545480), я хочу знать, есть ли встроенный Porter Stemmer в Java Java Apache OpenNLP, хотя есть интерфейс под этим пакетом [opennlp.tools.stemmer.Stemmer]. Поскольку я не знаю или не должен знать алгоритм, стоящий за этим, мне нужен стандартный пакет под apache opennlp toolkit. Если нет, какая альтернатива в Java?

1 ответ

Решение

Вы можете использовать Apache Lucene Snowball Library здесь

Просто поместите этот jar-файл в путь сборки и используйте его

PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem();  //stem the word
stemmer.getCurrent();//get the stemmed word
Другие вопросы по тегам