Простая таблица извлечения html dom по ее идентификатору
Я использую простой HTML-файл в PHP для извлечения таблицы в зависимости от ее идентификатора. Я сделал это без каких-либо проблем, когда идентификатор не включает в себя такие символы, как дефисы (-). Я подозреваю, что это из-за дефиса, потому что я использовал тот же код с идентификатором без дефисов и без проблем при получении данных. Данные, которые я хочу извлечь, также находятся на вкладке, которая скрыта, влияет ли это на процесс?
Вот мой код
<?php
include('simple_html_dom.php');
//Insert the url you want to extract data from
$html = file_get_html('http://espnfc.com/team/_/id/359/arsenal?cc=5739');
$i = 0;
$dataInTable = true;
while($dataInTable){
if($html->find('div[id=ui-tabs-1] table tbody', 0)->children(0)->children($i)){
for($j=0;$j<3;$j++){
if($html->find('div[id=ui-tabs-1] table tbody', 0)->children(0)->children($i)->children($j)){
$gk[] = $html->find('div[id=ui-tabs-1] table tbody', 0)->children(0)->children($i)->children($j)->plaintext;
}else{
$dataInTable = false;
}
}
//else if nothing is in the next cell return false.
}else{
$dataInTable = false;
}
$i+=2;
}
var_dump($gk);
?>
Вот содержание HTML
1 ответ
Когда вы посмотрите на источник (не через dev-tools, используйте browser->viewsource) http://espnfc.com/team/_/id/359/arsenal?cc=5739 вы ничего не увидите с идентификатор ui-tabs-1
Этот элемент был создан с помощью JavaScript(я думаю, jQueryUI-вкладки)
simple_html_dom
анализирует HTML, но не оценивает javascript, поэтому ответ таков:
Вы не можете выбрать этот элемент