SnowballStemmer("english") не работает со списком слов.
Я пытаюсь изучить стемминг в NLTK, и пока я пытаюсь составить слова с помощью SnowballStemmer, он застрял в PorterStemmer.
Хотя когда я пытаюсь составить одно слово, это работает правильно, но когда я пытаюсь создать список слов, он связан с PorterStemmer.
Я создал новый список под названием «Одиночные слова», чтобы добавить в него все основные слова, но результат не тот, который мне нужен.
Как вы можете видеть, когда я использовал «щедро», все выглядит нормально, но когда я пытаюсь напечатать «одиночные числа», которые должны включать все основные слова из списка «множественного числа», я получаю основные слова с помощью PorterStemmer.
from nltk.stem.snowball import SnowballStemmer
plurals = ['caresses', 'flies', 'dies', 'mules', 'denied','died', 'agreed', 'owned', 'humbled', 'sized','meeting', 'stating', 'siezing', 'itemization','sensational', 'traditional', 'reference', 'colonizer','plotted']
stemmer = SnowballStemmer("english")
singles = [stemmer.stem(plural) for plural in plurals]
print(SnowballStemmer("english").stem("generously"))
print(" ".join(singles))
Проблема в том, что я не знаю, что сказать «щедро», я хочу ограничить список под названием «множественное число». Я просто добавил слово «щедро», чтобы показать, что оно подходит для одного слова, но не для списка.
Буду очень признателен, если вы поможете мне понять, чего мне не хватает.