Проблема кодировки символов для французских символов

В веб-приложении есть HTML-страница с кодировкой ниже:

<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<meta content="en" http-equiv="Content-language">
<meta content="text/html; charset=UTF-8" http-equiv="Content-type">

Что на самом деле происходит на этой странице, я пытаюсь отобразить результат запроса мыла. В ответ на этот запрос мыла я получаю следующие коды:

&#232;&#233;&#224;&#249;&#236;&#231;&#242;

для следующих символов:

  èéàùìçò

и, что удивительно, на странице HTML эти символы правильно отображаются, как показано ниже, кроме кодировки страницы UTF-8:

èéàùìçò instead of ������� 

Я не могу понять, как эти коды можно правильно преобразовать в формат UTF-8, так как эти коды относятся к ISO-8859-15. Есть идеи?

1 ответ

Ссылки на символы, такие как &#232; имеют значения, основанные на количестве символов Unicode, совершенно независимо от кодировки символов страницы. Это всегда был принцип в HTML, и только очень ранние браузеры иногда ошибались. Это одно из основных преимуществ использования ссылок на символы.

Первые 256 позиций кода в Unicode идентичны позициям кода ISO-8859-1, которые, в свою очередь, идентичны позициям кода ISO-8859-15, за исключением нескольких символов (не считая тех, что в вашем примере).

Другие вопросы по тегам