Как преобразовать коды языков ISO639-1 в названия языков в Python?
У меня есть следующая серия Панд:
>>> df.original_language.value_counts()
en 32269
fr 2438
it 1529
ja 1350
de 1080
...
la 1
jv 1
sm 1
gl 1
mt 1
Name: original_language, Length: 92, dtype: int64
4
Я хочу преобразовать эти языковые коды в их оригинальные имена, например
en >> Английский
ar >> арабский
Я посмотрел на этот вопрос, но это не помогло. Если требуются какие-либо пакеты, по возможности укажите, как их установить с помощью pip.
1 ответ
Использовать модуль iso-639 ->
#pip install iso-639
from iso639 import languages
df['lang'] = df['lang'].apply(lambda x: languages.get(alpha2=x).name)
output -
lang count
0 English 32269
1 French 2438
2 Italian 1529
3 Japanese 1350
4 German 1080
5 Latin 1
6 Javanese 1
7 Samoan 1
8 Galician 1
9 Maltese 1
Если вы хотите преобразовать коды в исходный df, используйте -
from iso639 import languages
df['original_language'] = df['original_language'].apply(lambda x: languages.get(alpha2=x).name)