PHP: очистить неанглийские HTML-страницы

Question

PHP: очистить неанглийские HTML-страницы

Я пытаюсь проанализировать некоторые неанглийские страницы и извлечь соответствующую информацию, а затем показать извлеченную информацию на других страницах HTML. Однако я могу успешно извлечь соответствующий текст с помощью анализатора PHP Dom (simple_html_dom), однако я не могу показать извлеченный текст на языке оригинала. Я сделал простой скрипт, который бы просто получал текст с URL и показывал

заголовок ('Content-type: text/html; charset=utf-8');
$html = str_get_html(utf8_encode(file_get_contents('http://www.bhaskar.com/article-ht/INT-washington-capitol-hill-shooting-suspected-woman-shot-dead-by-police-4393270-PHO. HTML ')));
echo $html;

Я также приложил снимок экрана с тем, как показываются тексты.

Как я могу показать извлеченный текст на языке оригинала? Буду очень признателен за любую помощь.

-1

php character-encoding non-english

Источник

user1056194 04 окт '13 в 07:10

1 ответ

Другие вопросы по тегам php character-encoding non-english

user1407478 04 окт '13 в 08:41 2013-10-04 08:41 · Answer 1 · 2013-10-04 08:41

Не добавляя таинственные процедуры манипулирования строками, и не utf8_encode уже utf8_ закодированный контент:)

<?
header('Content-type: text/html; charset=utf-8');
echo file_get_contents('http://www.bhaskar.com/article-ht/INT-washington-capitol-hill-shooting-suspected-woman-shot-dead-by-police-4393270-PHO.html');
?>

работает отлично здесь, сидя в Дании, только вставляя вышеупомянутое в пустой файл php.