Как преобразовать коды языков ISO639-1 в названия языков в Python?

У меня есть следующая серия Панд:

      >>> df.original_language.value_counts()
en    32269
fr     2438
it     1529
ja     1350
de     1080
      ...  
la        1
jv        1
sm        1
gl        1
mt        1
Name: original_language, Length: 92, dtype: int64
4

Я хочу преобразовать эти языковые коды в их оригинальные имена, например

en >> Английский

ar >> арабский

Я посмотрел на этот вопрос, но это не помогло. Если требуются какие-либо пакеты, по возможности укажите, как их установить с помощью pip.

1 ответ

Использовать модуль iso-639 ->

      #pip install iso-639
from iso639 import languages
df['lang'] = df['lang'].apply(lambda x: languages.get(alpha2=x).name)

output -

             lang  count
0   English  32269
1    French   2438
2   Italian   1529
3  Japanese   1350
4    German   1080
5     Latin      1
6  Javanese      1
7    Samoan      1
8  Galician      1
9   Maltese      1

Если вы хотите преобразовать коды в исходный df, используйте -

      from iso639 import languages
df['original_language'] = df['original_language'].apply(lambda x: languages.get(alpha2=x).name)
Другие вопросы по тегам