Кодировка китайских символов (UTF-8, GBK)

У меня есть веб-сканер, который работает на разных веб-сайтах (в данном случае на китайском).

Теперь, когда я получаю данные и отображаю их на своем веб-сайте, все китайские иероглифы оказываются мусором. Ну, я читал о кодировке символов, и я обнаружил, что UTF-8 - вообще лучшая кодировка.

Теперь проблема заключается в том, что я использую UTF-8 - данные, отсканированные с веб-сайта 1, отображаются правильно, но не для веб-сайта 2.

Для WEBSITE-2 кодировка символов gb18030 работает правильно.

У меня вопрос, есть ли способ узнать кодировку символов для веб-сайта, чтобы я мог создать общее решение? Я имею в виду, что могу отобразить страницу на своем местном веб-сайте, зная, какую кодировку символов использовать. Таким образом, я могу кодировать в бэкэнде и не беспокоиться о том, какая кодировка необходима для открытия страницы.

Прямо сейчас у меня есть две страницы, одна для китайских символов UTF-8 и одна для китайских иероглифов GB18030.

1 ответ

Используйте метатег html "Content-Type" для html < 5 или метатег "char-set" для html 5

W3schools charset

Другие вопросы по тегам