Проблема кодировки символов для французских символов
В веб-приложении есть HTML-страница с кодировкой ниже:
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<meta content="en" http-equiv="Content-language">
<meta content="text/html; charset=UTF-8" http-equiv="Content-type">
Что на самом деле происходит на этой странице, я пытаюсь отобразить результат запроса мыла. В ответ на этот запрос мыла я получаю следующие коды:
èéàùìçò
для следующих символов:
èéàùìçò
и, что удивительно, на странице HTML эти символы правильно отображаются, как показано ниже, кроме кодировки страницы UTF-8:
èéàùìçò instead of �������
Я не могу понять, как эти коды можно правильно преобразовать в формат UTF-8, так как эти коды относятся к ISO-8859-15. Есть идеи?
1 ответ
Ссылки на символы, такие как è
имеют значения, основанные на количестве символов Unicode, совершенно независимо от кодировки символов страницы. Это всегда был принцип в HTML, и только очень ранние браузеры иногда ошибались. Это одно из основных преимуществ использования ссылок на символы.
Первые 256 позиций кода в Unicode идентичны позициям кода ISO-8859-1, которые, в свою очередь, идентичны позициям кода ISO-8859-15, за исключением нескольких символов (не считая тех, что в вашем примере).