.CONCODING международных символов (иврит, тайский, русский, китайский,....)

Международные html-файлы, заархивированные wget, должны содержать такие символы

(пример иврит и тайский:) אב הם и ยคน

вместо этого они сохраняются следующим образом:

Как правильно отобразить их?

iconv filename.html iconv: недопустимая последовательность ввода в позиции 1254

Решено: в этом не было ничего плохого Только я не заметил, что php.ini по умолчанию установил кодировку в заголовке http, но для использования различных кодировок, таких как эта мета http-эквивалент ="Content-Type" content="text/html; charset=windows-874", вам нужно было set: default_charset = "empty";....

1 ответ

Решение

Страницы не "сохраняются таким образом", все, что вы используете для просмотра файла, просто неправильно интерпретирует кодировку. Чтобы знать, в какой кодировке находится файл, вы должны были обратить внимание на HTTP Content-Type заголовок при загрузке; это ушло сейчас.
Ваш единственный другой шанс - проанализировать эквивалентный метатег HTML в <head>, если документ есть.

В противном случае вы можете только угадать кодировку документа.

Посмотрите, что каждый программист абсолютно, положительно должен знать о кодировках и наборах символов, чтобы работать с текстом для получения дополнительных необходимых базовых знаний.

Другие вопросы по тегам