Может ли адрес электронной почты содержать международные (не английские) символы?
Если это возможно, я должен принимать такие электронные письма от пользователей и какие проблемы ожидать, когда я буду отправлять почту на такие адреса?
7 ответов
Обновление 2015: использование RFC 6532
Экспериментальный 5335 был устаревшим: 6532 и
позже это было установлено на "Категория: Отслеживание стандартов",
делая это стандартом.
Раздел 3.2 (Расширения синтаксиса к RFC 5322) обновил большинство текстовых полей до
включить (правильно) UTF-8.
The following rules extend the ABNF syntax defined in [RFC5322] and
[RFC5234] in order to allow UTF-8 content.
VCHAR =/ UTF8-non-ascii
ctext =/ UTF8-non-ascii
atext =/ UTF8-non-ascii
qtext =/ UTF8-non-ascii
text =/ UTF8-non-ascii
; note that this upgrades the body to UTF-8
dtext =/ UTF8-non-ascii
The preceding changes mean that the following constructs now
allow UTF-8:
1. Unstructured text, used in header fields like
"Subject:" or "Content-description:".
2. Any construct that uses atoms, including but not limited
to the local parts of addresses and Message-IDs. This
includes addresses in the "for" clauses of "Received:"
header fields.
3. Quoted strings.
4. Domains.
Note that header field names are not on this list; these are still
restricted to ASCII.
Обратите внимание на явное включение доменов.
И явное исключение имен заголовков.
Также обратите внимание на NFKC:
The UTF-8 NFKC normalization form SHOULD NOT be used because
it may lose information that is needed to correctly spell
some names in some unusual circumstances.
И раздел 3 начинается:
Also note that messages in this format require the use of the
SMTPUTF8 extension [RFC6531] to be transferred via SMTP.
Проблема в том, что некоторые почтовые клиенты (серверные инструменты и / или инструменты рабочего стола) не поддерживают его и выдают исключение "недействительный адрес электронной почты", когда вы пытаетесь отправить сообщение на адрес, который, например, содержит умляуты.
Если вам нужна полная поддержка, вы можете преобразовать части адреса электронной почты в "punycode". Это позволяет пользователям вводить свои адреса обычным способом, но вы сохраняете его способом поддерживаемого уровня.
Пример: müller.com "xn--mller-kva.com
Оба указывают на одно и то же.
Я бы предположил, что да, поскольку ряд доменов верхнего уровня уже разрешают использование символов, не являющихся ascii, для доменов, и, поскольку домен является частью адреса электронной почты, это вполне возможно. Примером такого домена будет www.öko.de
Краткий ответ: да
допускается не только имя пользователя, но и имя домена.
Еще нет. IEEE планирует сделать это: статья H-Online: IEFT, планирующая интернационализированные адреса электронной почты, вот RfC: расширение SMTP для интернационализированных адресов электронной почты
Цитата из H-Online (как она понизилась):
Инженерная рабочая группа по Интернету (IETF) опубликовала три важных документа для стандартизации заголовков адресов электронной почты, которые включают символы вне набора символов ASCII. Это означает, что скоро вы сможете использовать китайские иероглифы, французские акценты и немецкие умляуты в адресах электронной почты, а также просто в тексте сообщения. Так что, если вас зовут Zoë и вы работаете в компании, которая делает фасады, вас может заинтересовать новый адрес электронной почты. Но представители провайдеров уже стонут. Они говорят, что должна быть "мания по обновлению", если стандарт Unicode UTF-8 должен заменить американский стандартный код для обмена информацией (ASCII), который в настоящее время используется в качестве основного языка электронной почты.
RFC 5335 определяет использование UTF-8 практически во всех заголовках электронной почты. Необходимо внести изменения в SMTP-клиентов, SMTP-серверы, почтовые агенты (MUA), программное обеспечение для списков рассылки, шлюзы на другие носители и везде, где электронная почта обрабатывается или передается. RFC 5336 расширяет транспортный протокол электронной почты SMTP. На уровне протокола расширение помечено как UTF8SMTP.
Новое поле заголовка будет добавлено как своего рода "аварийный парашют", чтобы обеспечить мягкую посадку писем UTF-8, если они выбрасываются до того, как они достигли получателя системами, которые не были обновлены. "Старый адрес" - это чисто ASCII-адрес. Но OldAddress не должен использоваться в качестве канала для второй попытки передачи, а скорее для того, чтобы обратная связь отправлялась домой.
Наконец, RFC5337 гарантирует, что отправляются правильные сообщения, относящиеся к состоянию доставки электронных писем, не относящихся к ASCII. Правильный адрес недоступного адресата должен быть отправлен обратно, даже если в дальнейшей транспортировке было отказано. Рабочая группа по интернационализации адресов электронной почты (EAI) также работает над рядом "механизмов понижения" для различных полей заголовка и конверта. Если возможно, исходная информация заголовка должна быть "упакована" и сохранена.
Немецкий DeNIC, регистратор домена ".de", тем не менее, принимает это с ходу. "Мы действительно мало что можем сделать, - пояснил представитель DeNIC Клаус Херциг. Вместо этого DeNIC уделяет больше внимания обновлению, над которым IETF работает для стандарта международных доменов - RFC3490 или IDNA2003, как его иногда называют. "Мы не очень рады этому, потому что обратной совместимости нет", - пояснил Херциг. Когда обновление выйдет, DeNIC заявляет, что переместит свой вес за символ "ß", также известный как estzett, который до сих пор игнорировался. Немецкий регистратор также говорит, что может немного подождать, прежде чем переключиться в свете отсутствия обратной совместимости. Как только новый стандарт будет работать стабильно, и регистраторы и провайдеры примут его, будет добавлен ß.
В отличие от этого, эксперты полагают, что китайские регистраторы в Китае и на Тайване быстро осуществят изменение для интернационализированной электронной почты. Представители CNIC и TWNIC являются авторами стандартов. Китайские пользователи в настоящее время должны писать электронные письма в ASCII слева от @ и с китайскими символами справа от него для китайских доменов, которые уже были интернационализированы.
(Моника Эрмерт)
Ответ - да, но они должны быть специально закодированы.
Посмотри на это. Прочитайте часть, которая относится к заголовкам электронной почты и RFC 2047.