Многоязыковая лемматизация в Python

У меня есть набор данных на нескольких языках. я могу применить лемматизацию в соответствии с ее языком? Я уже разделил данные в соответствии с их языком. Пробовал с использованием WordNet лемматизации, но он поддерживает только английский язык

Для использования нескольких языков я использую snowballStemmer.

1 ответ

Решение

Попробуйте использовать spacy. Он поддерживает более 34 языков и имеет лемматизатор.

Другие вопросы по тегам