Как получить конкретную HTML-таблицу с веб-страницы в R?

Question

Как получить конкретную HTML-таблицу с веб-страницы в R?

Веселого Рождества stackru команда и читатели! я использую Rstudio и я с трудом пытаюсь получить htmltable с веб-страницы. Веб-страница находится здесь, и таблица, которую я хочу получить, имеет следующий XPath: //*[@id="h2hMatches"]

Вот что я попробовал с точки зрения моего R коды:

library(rvest)
library(magrittr)

webpage <- read_html("https://www.soccerpunter.com/soccer-statistics/England/Premier-League-2017-2018/head_to_head_statistics/all/675_Tottenham_Hotspur_FC/670_Southampton_FC")

tbls <- html_nodes(webpage, "table")

head(tbls)

Результат вышеупомянутого является следующим:

{xml_nodeset (6)}
[1] <table border="0" align="center" cellpadding="4" cellspacing="1" class="normaltext">\n<tr>\n<td colspan="2" class= ...
[2] <table border="0" cellpadding="0" cellspacing="0" id="content">\n<!--DWLayoutTable--><tr>\n<td valign="top" id="ce ...
[3] <table width="100%" border="0" cellpadding="0" cellspacing="0"><tr>\n<td><table width="640" cellpadding="0" cellsp ...
[4] <table width="640" cellpadding="0" cellspacing="0" bgcolor="#FFFFFF">\n<tr>\n<td> \r\n\r\n                         ...
[5] <table id="h2hHead" width="100%">\n<tr>\n<td width="200"><h2><a href="/soccer-statistics/England/Premier-League-20 ...
[6] <table id="matchInfo" class="infoTable">\n<tr>\n<td class="infoName">Competition:</td>\n                        <t ...

Я не могу найти тот идентификатор таблицы, который равен "h2Matches" из вывода.

Что я делаю неправильно? Есть ли другой способ получения этой конкретной таблицы?

0

r web-scraping html-table rvest

Источник

user3115933 25 дек '17 в 10:45

0 ответов

Другие вопросы по тегам r web-scraping html-table rvest