PHP: Как очистить содержимое сайта на основе Javascript

Я пытаюсь получить содержимое этого сайта с помощью библиотеки PHP simplehtmldom.

http://www.immigration.govt.nz/migrant/stream/work/workingholiday/czechwhs.htm"

Это не работает, поэтому я попытался использовать CURL:

function curl_get_file_contents($URL)
{
    $c = curl_init();
    curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($c, CURLOPT_URL, $URL);
    $contents = curl_exec($c);
    curl_close($c);

    if ($contents) return $contents;
    else return FALSE;
}

Но всегда делайте перестановку только с некоторым JS-кодом и контентом:

<noscript>Please enable JavaScript to view the page content.</noscript>

Есть ли возможность решить эту проблему с помощью PHP? Я должен использовать PHP в этом случае, поэтому мне нужно моделировать браузер на основе JS.

Большое спасибо за любые советы.

1 ответ

Решение

Я должен использовать PHP в этом случае, поэтому мне нужно моделировать браузер на основе JS.

Я бы порекомендовал вам два способа:

  1. Используйте PHP-плагин v8js для работы с js сайта при очистке. Смотрите здесь пример использования.
  2. Имитация браузера на основе JS с использованием Selenium, iMacros или webRobots.io Chrome ext. Но в этом случае вы отключили PHP-скриптинг.
Другие вопросы по тегам