Как получить InnerHTML динамической загрузки веб-страницы?
Я новичок в Java и использую библиотеку jaunt1.3.8 для веб-очистки. Я пытаюсь получить InnerHTML на веб-странице: https://www.justdial.com/Pune/Cake-Shops/nct-10070075.
сайт не покажет нам полный список результатов поиска. когда мы достигнем нижней части страницы, она загрузится снова.
он прекратит загрузку после 10 свитков.
Я хочу удалить данные этой динамически загружаемой веб-страницы с помощью библиотеки jaunt1.3.8, но я не знаю, как это сделать.
1 ответ
Это ваша первая страница: https://www.justdial.com/Pune/Cake-Shops/nct-10070075/page-1
PagniaE = " https://www.justdial.com/Pune/Cake-Shops/nct-10070075/page-1";
Сделайте цикл:
while (IniPag<=100) {
userAgent.visit(PaginaE);
// (do someting)...
PaginaE = PaginaE.replace("page1","page2"); //Dynamic
}