Как нелатинские символы Юникода кодируются в доменном имени?
Скажем, у меня есть URL, такой как:
http://ほっけがおいしい.com
Если я вставлю это в любой браузер, я получу:
http://xn--n8jaqhy3b1euj.com/
Каков алгоритм для преобразования символов Unicode в простые латинские символы? Кажется, это должно быть легко с Google, но я действительно не могу найти ничего.
Я хочу изменить это - учитывая последнее, я хочу получить первое.
Сценарий использования заключается в том, что я хочу передавать некоторую информацию об iPhone между приложениями с использованием обработчиков URL, но я не могу гарантировать, что содержимое будет состоять из латинских символов.
1 ответ
Решение
Я не уверен, охватывает ли это все, я не прочитал все RFC, но это может быть хорошим местом для начала: RFC, относящиеся к IDN