Встроенный Porter Stemmer в Java OpenNLP инструментарий
Как есть встроенные в Stemmers, такие как Porter Stemmer в Python NLTK ( /questions/11545467/nuzhen-modul-python-dlya-prohozhdeniya-tekstovyih-dokumentov/11545480#11545480), я хочу знать, есть ли встроенный Porter Stemmer в Java Java Apache OpenNLP, хотя есть интерфейс под этим пакетом [opennlp.tools.stemmer.Stemmer]. Поскольку я не знаю или не должен знать алгоритм, стоящий за этим, мне нужен стандартный пакет под apache opennlp toolkit. Если нет, какая альтернатива в Java?
1 ответ
Решение
Вы можете использовать Apache Lucene Snowball Library здесь
Просто поместите этот jar-файл в путь сборки и используйте его
PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem(); //stem the word
stemmer.getCurrent();//get the stemmed word