Многоязыковая лемматизация в Python
У меня есть набор данных на нескольких языках. я могу применить лемматизацию в соответствии с ее языком? Я уже разделил данные в соответствии с их языком. Пробовал с использованием WordNet лемматизации, но он поддерживает только английский язык
Для использования нескольких языков я использую snowballStemmer.
1 ответ
Решение
Попробуйте использовать spacy. Он поддерживает более 34 языков и имеет лемматизатор.