Как нормализовать семантически одинаковые языковые теги? [кладр]
В настоящее время я просматриваю базу данных cldr-common-42 и нахожу использование языковых тегов немного запутанным. Например, тегar-EG
используется для переводов на египетский арабский язык. Однако, когда я ищу, что такое «египетский арабский язык» на других языках, мне нужно искать кодarz
.
Есть ли способ нормализовать такие случаи программным способом (например, аккуратной базой данных, содержащей обе формы)? Кроме того, какую форму следует предпочесть для какого контекста?
Я искал в Интернете базы данных, содержащие обе формы, но нашел только те базы данных, в которых они никак не были связаны.
Рад за всех, кто может прояснить для меня некоторые вещи и, возможно, указать мне на некоторые ресурсы для нормализации!