Выскабливание по клику
Я пытаюсь почистить отзывы на этой странице.
http://www.tripadvisor.com/Hotel_Review-g294265-d2309275-Reviews-The_Forest_by_Wangz-Singapore.html
Единственная проблема в каждом обзоре - "Больше", который загружает больше текста в событие OnClick.
Например:
<span class="taLnk hvrIE6 tr147826763 moreLink" onclick = " ta.util.cookie.setPIDCookie(2247); ta.call('ta.servlet.Reviews.expandReviews', event,this,'review_147826763', '1', 2247)">
More </span>
Как удалить полный текст отзыва, используя LXML/BeautifulSoup?
1 ответ
Вероятно, это не тот ответ, который вы ищете, но я начал изучать PhantomJS, который предоставляет вам браузер без веб-интерфейса с поддержкой сценариев. Могу поспорить, что это более простой путь, чем какой-либо кроличья нора для обратного инжиниринга ajax, которую вы собираетесь спустить