.CONCODING международных символов (иврит, тайский, русский, китайский,....)
Международные html-файлы, заархивированные wget, должны содержать такие символы
(пример иврит и тайский:) אב הם и ยคน
вместо этого они сохраняются следующим образом:
Как правильно отобразить их?
iconv filename.html iconv: недопустимая последовательность ввода в позиции 1254
Решено: в этом не было ничего плохого Только я не заметил, что php.ini по умолчанию установил кодировку в заголовке http, но для использования различных кодировок, таких как эта мета http-эквивалент ="Content-Type" content="text/html; charset=windows-874", вам нужно было set: default_charset = "empty";....
1 ответ
Страницы не "сохраняются таким образом", все, что вы используете для просмотра файла, просто неправильно интерпретирует кодировку. Чтобы знать, в какой кодировке находится файл, вы должны были обратить внимание на HTTP Content-Type
заголовок при загрузке; это ушло сейчас.
Ваш единственный другой шанс - проанализировать эквивалентный метатег HTML в <head>
, если документ есть.
В противном случае вы можете только угадать кодировку документа.
Посмотрите, что каждый программист абсолютно, положительно должен знать о кодировках и наборах символов, чтобы работать с текстом для получения дополнительных необходимых базовых знаний.