Извлечь звездный рейтинг из Trip Advisor

В целях самообучения (сканирование в Интернете) я хочу извлечь оценки, данные пользователем, с веб-сайта Trip Advisor. Ниже приведен код, который я написал на R, но он не работает. Можете ли вы предложить мне или дать правильный код? Мне также не удалось использовать пакет Rvest.

library(XML)
dat <- readLines("http://www.tripadvisor.in/Hotel_Review-g60763-d93450-Reviews-Grand_Hyatt_New_York-New_York_City_New_York.html", warn=FALSE)
raw2 <- htmlTreeParse(dat, useInternalNodes = TRUE)

##Rating
data <- xpathApply(raw2,"//div[@class='col2of2']//span[@class='rate sprite-rating_s rating_s']/img[@alt]",xmlValue)
Rating <- sapply(data,function(x) xmlAttrs(x)["alt"])
Result <- unlist(Rating)
Result

1 ответ

Решение

Ты можешь использовать

##Rating
Result <- xpathSApply(raw2,"//div[@class='col2of2']//span[@class='rate sprite-rating_s rating_s']/img", xmlGetAttr, "alt")
Другие вопросы по тегам