Как получить InnerHTML динамической загрузки веб-страницы?

Я новичок в Java и использую библиотеку jaunt1.3.8 для веб-очистки. Я пытаюсь получить InnerHTML на веб-странице: https://www.justdial.com/Pune/Cake-Shops/nct-10070075.

сайт не покажет нам полный список результатов поиска. когда мы достигнем нижней части страницы, она загрузится снова.

он прекратит загрузку после 10 свитков.

Я хочу удалить данные этой динамически загружаемой веб-страницы с помощью библиотеки jaunt1.3.8, но я не знаю, как это сделать.

1 ответ

Это ваша первая страница: https://www.justdial.com/Pune/Cake-Shops/nct-10070075/page-1

PagniaE = " https://www.justdial.com/Pune/Cake-Shops/nct-10070075/page-1";

Сделайте цикл:

while (IniPag<=100) {
  userAgent.visit(PaginaE);
  // (do someting)...
  PaginaE = PaginaE.replace("page1","page2"); //Dynamic
}
Другие вопросы по тегам