PHP: Как очистить содержимое сайта на основе Javascript
Я пытаюсь получить содержимое этого сайта с помощью библиотеки PHP simplehtmldom.
http://www.immigration.govt.nz/migrant/stream/work/workingholiday/czechwhs.htm"
Это не работает, поэтому я попытался использовать CURL:
function curl_get_file_contents($URL)
{
$c = curl_init();
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($c, CURLOPT_URL, $URL);
$contents = curl_exec($c);
curl_close($c);
if ($contents) return $contents;
else return FALSE;
}
Но всегда делайте перестановку только с некоторым JS-кодом и контентом:
<noscript>Please enable JavaScript to view the page content.</noscript>
Есть ли возможность решить эту проблему с помощью PHP? Я должен использовать PHP в этом случае, поэтому мне нужно моделировать браузер на основе JS.
Большое спасибо за любые советы.
1 ответ
Решение
Я должен использовать PHP в этом случае, поэтому мне нужно моделировать браузер на основе JS.
Я бы порекомендовал вам два способа:
- Используйте PHP-плагин v8js для работы с js сайта при очистке. Смотрите здесь пример использования.
- Имитация браузера на основе JS с использованием Selenium, iMacros или webRobots.io Chrome ext. Но в этом случае вы отключили PHP-скриптинг.