Описание тега ietf-bcp-47
Обзор
Документ IETF представляет собой документ с «передовой современной практикой» для идентификации письменных и разговорных языков посредством создания языковых тегов .
Документ:
«указывает конкретный механизм идентификатора (языковой тег) и функцию регистрации значений, которые будут использоваться для формирования тегов».
Основные примеры
-
fr
- Французский - - Канадский французский
- - Испанский, используемый в Латинской Америке и Карибском бассейне.
-
zh-Hant
- Китайский язык написан с использованием традиционного ханьского письма.
Обзор структуры
Языковые теги BCP 47 имеют гибкую структуру, которая может содержать следующие вложенные теги, разделенные тире:
language-extlang-script-region-variant-extension-private
The language
subtag является обязательным и должен стоять первым. Его значения взяты из языковых кодов ISO 639 .
The extlang
(расширенный язык) вложенный тег можно использовать для большей конкретики, например,cmn
для китайского языка вzh-cmn
(китайский).
The script
вложенный тег можно использовать для того, чтобы различать разные письменные форматы языка (например,Hant
против.Hans
для традиционного и упрощенного китайского).
The region
вложенный тег может быть кодом страны (CA
вfr-CA
) или региональный код ООН M.49 (419
вes-419
).
The variant
subtag может обеспечить более точное определение диалектов и сценариев. Это обычно не требуется в наиболее распространенных случаях использования.
The extension
иprivate
вложенные теги могут использоваться для дополнительных настраиваемых языковых данных.
Ресурсы
- спецификацииBCP 47Документ
- W3C по языковым тегамРуководство
- Руководство Unicode CLDR по выбору правильного идентификатора языка
- языковых теговСлужба поиска и проверки