Как нелатинские символы Юникода кодируются в доменном имени?

Скажем, у меня есть URL, такой как:

http://ほっけがおいしい.com

Если я вставлю это в любой браузер, я получу:

http://xn--n8jaqhy3b1euj.com/

Каков алгоритм для преобразования символов Unicode в простые латинские символы? Кажется, это должно быть легко с Google, но я действительно не могу найти ничего.

Я хочу изменить это - учитывая последнее, я хочу получить первое.

Сценарий использования заключается в том, что я хочу передавать некоторую информацию об iPhone между приложениями с использованием обработчиков URL, но я не могу гарантировать, что содержимое будет состоять из латинских символов.

1 ответ

Решение

Я не уверен, охватывает ли это все, я не прочитал все RFC, но это может быть хорошим местом для начала: RFC, относящиеся к IDN

Другие вопросы по тегам