Использование предпочтительного значения в записях языковых тегов типа "Вариант" (RFC 5646)

В RFC 5646, Теги для идентификации языков, § 3.1.2 Определения записей и полей, приводится следующее объяснение семантики поля Preferred-Value при появлении в записи, тип которой "вариант":

  • Для полей типа "скрипт", "регион" или "вариант" "Preferred-Value" содержит подтэг того же типа, который предпочтителен для формирования языкового тега.

Моя первоначальная интерпретация этого состояла в том, что если тип записи является вариантом, то значение Preferred-Value также является вариантом - "subtag того же типа". Другими словами, я читаю "того же типа", что и "того же типа, что и сама запись".

Однако в текущей версии реестра языковых тегов есть записи (в то время, когда я это пишу, 2018-04-23 - кажется, что нет версий), которые не соответствуют этой интерпретации. Например:

Type: variant
Subtag: arevela
Description: Eastern Armenian
Added: 2006-09-18
Deprecated: 2018-03-24
Preferred-Value: hy
Prefix: hy

Предпочтительное значение здесь не является вариантом - вариант должен состоять из 5-8 буквенно-цифровых символов ASCII или 1 цифры плюс три буквенно-цифровых символа. В частности, в данном случае ясно, что это относится к армянскому языку (первый сегмент языкового тега), а не к варианту.

Однако при просмотре других записей большинство значений Preferred-Value соответствуют моей первоначальной интерпретации. Например:

Type: region
Subtag: YD
Description: Democratic Yemen
Added: 2005-10-16
Deprecated: 1990-08-14
Preferred-Value: YE

Здесь Preferred-Value, похоже, является другим кодом региона. Правила для типов сценария / региона / варианта даны вместе - Preferred-Value - это "один и тот же тип" для всех них. Если для записи региона "Preferred-Value" того же типа означает "также регион", то как для варианта записи Preferred-Value может указывать на другой тип? Что еще более важно, если это возможно, является ли единственный способ определить тип поля Preferred-Value для проверки его грамматики?

1 ответ

Ты прав. Эта запись не соответствует спецификации реестра. Кажется, они это заметили; в реестре от 23.02.2021 появилась новая запись для arevela без этого Preferred-Value. Вместо этого в нем есть комментарий «Предпочтительный тег - hy».

Что касается ваших комментариев: я не думаю, что раздел в спецификации предполагает, что все extlangs должны иметь предпочтительное значение. Соответствующая часть:

Записи, содержащие «предпочтительное значение», попадают в одну из следующих четырех групп:

[...]

  1. Вложенные теги расширенного языка всегда имеют сопоставление с идентичными вложенными тегами основного языка.

Я думаю, это означает, что если запись содержит предпочтительное значение и это дополнительный язык, то предпочтительным значением будет идентичный вложенный тег основного языка. Фактически, у большинства расширенных языковых подтэгов нет предпочтительных значений.

Другие вопросы по тегам