Как очистить содержимое динамической веб-страницы в PHP?

Мне нужно очистить содержимое динамической веб-страницы с помощью PHP. Я знаю, как использовать DOM и очищать содержимое со статической веб-страницы, но не знаю, как очистить содержимое от динамической страницы.

Например, Мне нужно соскрести содержимое с этой страницы с этой страницы под KEY RATIOS раздел и под этим GROWTH TAB, Я не могу найти нужную мне информацию на веб-странице в источнике страницы.

Я немного борюсь с тем, с чего начать. Любая помощь будет оценена.

2 ответа

Решение

Просматривая страницу, кажется, что данные, которые вы хотите, содержатся в этом файле. Я хотел бы получить этот файл и затем использовать эти методы PHP для анализа полученного файла CSV.

Таким образом, в качестве ответа на ваш первоначальный вопрос, один из способов очистки содержимого динамической страницы - очистка содержимого, из которого динамическая страница получает данные.

Редактировать:

Вот пример кода.

$handle = fopen("http://financials.morningstar.com/ajax/exportKR2CSV.html?&callback=?&t=STO&region=usa&culture=en-US", "r");
while ($row = fgetcsv($handle)) {
    // do stuff with the row
}
fclose($handle);

http://financials.morningstar.com/ratios/r.html?t=STO&culture=en-US является прямой ссылкой. Вполне вероятно, однако, что они используют JavaScript для создания этой вкладки. Файл javascript, который выполняет вызов ajax, является http://financials.morningstar.com/fundamental/script/SRT_keyStats.js и на самом деле довольно хорошо задокументирован. Ищите "ajax", чтобы получить больше информации.

Другие вопросы по тегам