Python возвращает BCP47 предложения
У меня есть это предложение на питоне:
«Вендель - отличный пловец»
Результат должен быть en-US или en-GB.
Я хочу вернуть языковой тег предложения BCP47. Я пробовал с парой библиотек, но они никогда не дают полный языковой тег, то есть «en-US», они дают только «en»
Библиотеки, которые я использовал:
SpaCy - но это дает только первые две цифры BCP47
Pycld2 - такие же, как и выше, отличные библиотеки, но возвращают только en... мне нужно, например, en-US или en-GB
Это шаблон с большинством библиотек, которые не дают полной разбивки BCP47. Может ли кто-нибудь указать мне в правильном направлении, пожалуйста.
Спасибо