gtrends r package - иногда изменяется количество обращений со временем

У меня возникли проблемы с использованием пакета gtrends r. Я использую "R Studio версии 1.1.463", работаю "R версии 3.5.1.".

Когда я ищу конкретное ключевое слово, иногда историческая серия хитов сильно меняется. Вот пример:

library(gtrendsR)

cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)

cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)

cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)

Ответ, который я получаю за этот простой код, следующий:

> library(gtrendsR)
> 
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1]  70  34  51 100  67  35

Как видите, конфигурация каждого поиска точно такая же. Но серия хитов меняется на третьем (я показываю только первые члены с функцией "голова", но есть изменения во всей исторической серии "хитов"). Это происходит случайным образом для других поисков, которые я тоже делаю, даже запрашивая другой вид вывода, как опция "Interest_by_region$hit".

Я искал на веб-сайте Google Trends, как строятся данные, и я понимаю, что историческая серия "хитов" может измениться, как только "хиты" выявят относительную популярность или ключевое слово, которое нормализуется в диапазоне 0-100. Но должна ли структура данных измениться, как в моем примере?

Я что-то теряю?

Я приветствую любую помощь!

Большое спасибо!

0 ответов

У меня было такое же беспокойство. В вашем коде буквально нет недостатков. Похоже, что Google случайным образом извлекает подмножество фактических частот поиска для расчета индекса для более быстрого ответа. Однако в известной статье в области финансов (см. Сноску 4 на стр.1467 в Da et al.(2011) показано, что эта проблема была бы несущественной, если бы у вас был более длительный период времени. Честно говоря, эта проблема серьезна, если вы запрашиваете только короткое время В твоем случае у меня до сих пор нет решения.

Другие вопросы по тегам