Извлечь узел с помощью R

Я хотел бы проанализировать таблицу по ссылке http://www.espn.com/nfl/team/schedule/_/name/bal/baltimore-ravens

Вся необходимая информация хранится в узле //tbody (XPath - //*[@id="my-team-table"]/div[3]/div/table/tbody)

Теперь я пытаюсь в R с пакетом XML,

html_page <- htmlTreeParse(url, useInternalNodes = TRUE) topNode <- xmlRoot(html_page) content <- getNodeSet(topNode, "//tbody")

Тем не менее, это дает мне пустое значение.

1 ответ

Мы можем использовать rvest

library(rvest)
tbl <- read_html(url)  %>%
            html_nodes("table") %>%
            html_table(fill = TRUE, header = TRUE) %>%
            as.data.frame

данные

url <- "http://www.espn.com/nfl/team/schedule/_/name/bal/baltimore-ravens"
Другие вопросы по тегам