Сбор данных с помощью rvest не получает значения из виджета данных
Я пытаюсь собрать данные, используя rvest
(также пытался использовать XML
а также selectr
) но у меня возникают проблемы со следующей проблемой:
В веб-инспекторе моего браузера HTML выглядит так
<span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.45</span>
(Заметка: rate-down
а также 1226.45
периодически обновляются.) Хочу ловить 1226.45
но когда я запускаю свой код (ниже), он говорит, что там не хранится информация. Это как-то связано с тем, что это виджет? Будем благодарны за любые предложения о том, как поступить.
library(rvest);library(selectr);library(XML)
zoom.turbo.url <- "https://www.zoomtrader.com/trade-now?game=turbo"
zoom.turbo <- read_html(zoom.turbo.url)
# Navigate to node
zoom.turbo <- zoom.turbo %>% html_nodes("span") %>% `[[`(90)
# No value
as.character(zoom.turbo)
html_text(zoom.turbo)
# Using XML and Selectr
doc <- htmlParse(zoom.turbo, asText = TRUE)
xmlValue(querySelector(doc, 'span'))
1 ответ
Для сайтов, которые трудно очистить, например, когда контент динамический, вы можете использовать RSelenium
, С этим пакетом и докером браузера вы можете перемещаться по сайтам с помощью команд R.
Я использовал этот метод для очистки веб-сайта с динамическим сценарием входа в систему, который я не мог использовать для других методов.