Извлечь звездный рейтинг из Trip Advisor
В целях самообучения (сканирование в Интернете) я хочу извлечь оценки, данные пользователем, с веб-сайта Trip Advisor. Ниже приведен код, который я написал на R, но он не работает. Можете ли вы предложить мне или дать правильный код? Мне также не удалось использовать пакет Rvest.
library(XML)
dat <- readLines("http://www.tripadvisor.in/Hotel_Review-g60763-d93450-Reviews-Grand_Hyatt_New_York-New_York_City_New_York.html", warn=FALSE)
raw2 <- htmlTreeParse(dat, useInternalNodes = TRUE)
##Rating
data <- xpathApply(raw2,"//div[@class='col2of2']//span[@class='rate sprite-rating_s rating_s']/img[@alt]",xmlValue)
Rating <- sapply(data,function(x) xmlAttrs(x)["alt"])
Result <- unlist(Rating)
Result
1 ответ
Решение
Ты можешь использовать
##Rating
Result <- xpathSApply(raw2,"//div[@class='col2of2']//span[@class='rate sprite-rating_s rating_s']/img", xmlGetAttr, "alt")