R: readr: возможно ли читать HTML-таблицы с помощью этого пакета
Я хочу знать, сможем ли мы достичь html-таблиц, используя пакет readr с URL-адресом страницы, на которой опубликована html-таблица. Например, я хочу импортировать таблицу на страницу для загрузки в R.
1 ответ
Я не уверен, что может быть "чизамп", но Скривен прав, хотя с небольшим количеством дополнительной лапши, необходимой, чтобы выяснить, какая из нескольких таблиц возвращается XML::readHTMLTables
может быть тот, который вы хотели:
> library(XML)
> help(pack=XML)
> sports <- readHTMLTable("http://sports.yahoo.com/nfl/stats/byteam?group=Offense&cat=Total&conference=NFL&year=season_2010&sort=530&old_category=Total&old_group=Offense")
> str(sports[[1]])
'data.frame': 1 obs. of 2 variables:
$ V1: Factor w/ 1 level "": 1
$ V2: Factor w/ 1 level "Search SportsSearch Web": 1
> str(sports[[2]])
'data.frame': 2 obs. of 1 variable:
$ : Factor w/ 2 levels "","Sortable Stats": 2 1
> length(sports)
[1] 8
> str(sports[[8]])
NULL
# top of str() on the seventh item in that list
str(sports[[7]])
'data.frame': 32 obs. of 28 variables:
$ Team : Factor w/ 32 levels "Arizona Cardinals",..: 19 26 24 14 2 23 21 9 13 12 ...
$ : Factor w/ 1 level "": 1 1 1 1 1 1 1 1 1 1 ...
$ G : Factor w/ 1 level "16": 1 1 1 1 1 1 1 1 1 1 ...
$ : Factor w/ 1 level "": 1 1 1 1 1 1 1 1 1 1 ...
$ Pts/G : Factor w/ 28 levels "12.3","16.9",..: 28 27 26 25 24 23 22 22 21 20 ...