Извлечь узел с помощью R
Я хотел бы проанализировать таблицу по ссылке http://www.espn.com/nfl/team/schedule/_/name/bal/baltimore-ravens
Вся необходимая информация хранится в узле //tbody (XPath - //*[@id="my-team-table"]/div[3]/div/table/tbody)
Теперь я пытаюсь в R с пакетом XML,
html_page <- htmlTreeParse(url, useInternalNodes = TRUE)
topNode <- xmlRoot(html_page)
content <- getNodeSet(topNode, "//tbody")
Тем не менее, это дает мне пустое значение.
1 ответ
Мы можем использовать rvest
library(rvest)
tbl <- read_html(url) %>%
html_nodes("table") %>%
html_table(fill = TRUE, header = TRUE) %>%
as.data.frame
данные
url <- "http://www.espn.com/nfl/team/schedule/_/name/bal/baltimore-ravens"