URL-кодировка в адресной строке браузера

Когда я помещаю некоторые не буквенно-цифровые символы в адресную строку браузера, они получают URL-кодировку. Например, http://ru2.php.net/manual-lookup.php?pattern= привет превращается в http://ru2.php.net/manual-lookup.php?pattern=%EF%F0%E8%E2%E5%F2.

Вопрос в том, что означают эти две шестнадцатеричные цифры с префиксом?

1 ответ

Решение

Это байты кодировки кириллицы в Windows 1251. Поскольку их всего шесть, они не могут быть UTF-8, поскольку для 6 символов кириллицы требуется 12 байтов UTF-8.

Кодовую таблицу для CP1251 можно найти здесь: http://en.wikipedia.org/wiki/Windows-1251.

Точно так же, как 20 - шестнадцатеричное для пробела, каждый из кириллических символов имеет свое числовое значение, выражаемое в виде двух шестнадцатеричных цифр.

Другие вопросы по тегам