gtrends r package - иногда изменяется количество обращений со временем
У меня возникли проблемы с использованием пакета gtrends r. Я использую "R Studio версии 1.1.463", работаю "R версии 3.5.1.".
Когда я ищу конкретное ключевое слово, иногда историческая серия хитов сильно меняется. Вот пример:
library(gtrendsR)
cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)
cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)
cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)
Ответ, который я получаю за этот простой код, следующий:
> library(gtrendsR)
>
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1] 0 0 24 46 24 24
>
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1] 0 0 24 46 24 24
>
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1] 70 34 51 100 67 35
Как видите, конфигурация каждого поиска точно такая же. Но серия хитов меняется на третьем (я показываю только первые члены с функцией "голова", но есть изменения во всей исторической серии "хитов"). Это происходит случайным образом для других поисков, которые я тоже делаю, даже запрашивая другой вид вывода, как опция "Interest_by_region$hit".
Я искал на веб-сайте Google Trends, как строятся данные, и я понимаю, что историческая серия "хитов" может измениться, как только "хиты" выявят относительную популярность или ключевое слово, которое нормализуется в диапазоне 0-100. Но должна ли структура данных измениться, как в моем примере?
Я что-то теряю?
Я приветствую любую помощь!
Большое спасибо!
0 ответов
У меня было такое же беспокойство. В вашем коде буквально нет недостатков. Похоже, что Google случайным образом извлекает подмножество фактических частот поиска для расчета индекса для более быстрого ответа. Однако в известной статье в области финансов (см. Сноску 4 на стр.1467 в Da et al.(2011) показано, что эта проблема была бы несущественной, если бы у вас был более длительный период времени. Честно говоря, эта проблема серьезна, если вы запрашиваете только короткое время В твоем случае у меня до сих пор нет решения.