Как получить конкретную HTML-таблицу с веб-страницы в R?
Веселого Рождества stackru
команда и читатели! я использую Rstudio
и я с трудом пытаюсь получить html
table
с веб-страницы. Веб-страница находится здесь, и таблица, которую я хочу получить, имеет следующий XPath: //*[@id="h2hMatches"]
Вот что я попробовал с точки зрения моего R
коды:
library(rvest)
library(magrittr)
webpage <- read_html("https://www.soccerpunter.com/soccer-statistics/England/Premier-League-2017-2018/head_to_head_statistics/all/675_Tottenham_Hotspur_FC/670_Southampton_FC")
tbls <- html_nodes(webpage, "table")
head(tbls)
Результат вышеупомянутого является следующим:
{xml_nodeset (6)}
[1] <table border="0" align="center" cellpadding="4" cellspacing="1" class="normaltext">\n<tr>\n<td colspan="2" class= ...
[2] <table border="0" cellpadding="0" cellspacing="0" id="content">\n<!--DWLayoutTable--><tr>\n<td valign="top" id="ce ...
[3] <table width="100%" border="0" cellpadding="0" cellspacing="0"><tr>\n<td><table width="640" cellpadding="0" cellsp ...
[4] <table width="640" cellpadding="0" cellspacing="0" bgcolor="#FFFFFF">\n<tr>\n<td> \r\n\r\n ...
[5] <table id="h2hHead" width="100%">\n<tr>\n<td width="200"><h2><a href="/soccer-statistics/England/Premier-League-20 ...
[6] <table id="matchInfo" class="infoTable">\n<tr>\n<td class="infoName">Competition:</td>\n <t ...
Я не могу найти тот идентификатор таблицы, который равен "h2Matches" из вывода.
Что я делаю неправильно? Есть ли другой способ получения этой конкретной таблицы?