Разобрать HTML div ID включает все внутреннее содержимое
Я пытаюсь проанализировать HTML-файл и получить все содержимое в div
$some_html = file_get_contents($html);
$dom = new DOMDocument();
@$dom->loadHtml($some_html);//Strict error checking off
$xpath = new DOMXPath($dom);
$result = $xpath->query('//*[@id="IDX-detailsWrapper"]');
if (!empty($result)) {
foreach ( $result as $link ) {var_dump($link->nodeValue); }}
HTML:
<div id="IDX-detailsWrapper"><div id=content><h1>test</h1></div></div>
Я надеюсь получить следующую строку
`<div id=content><h1>test</h1></div>`
вместо
`test`
В настоящее время это только получение текста, содержащегося в div, а не в html.
Хотя я не уверен в точной практике делать это!
Спасибо JT
1 ответ
Решение
Я закончил тем, что использовал библиотеку от http://sourceforge.net/projects/simplehtmldom/files/
и пример кода, который работает
include('simple_html_dom.php');
$html = file_get_html($html);
foreach($html->find('div#IDX-detailsWrapper') as $e)
echo $e->innertext . '<br>';
Надеюсь, это поможет кому-то:)