Динамически вставляйте переменные в модель fable с помощью rlang
Я пытаюсь динамически вставлять переменные в модель басни.
Данные
library(dplyr)
library(fable)
library(stringr)
df <- tsibbledata::aus_retail %>%
filter(State == "Victoria", Industry == "Food retailing") %>%
mutate(reg_test = rnorm(441, 5, 2),
reg_test2 = rnorm(441, 5, 2))
Обратите внимание, что в tsibble может быть неопределенное количество регрессоров, но в этом примере у меня только два (reg_test
а также reg_test2
). Все столбцы регрессора будут начинаться сreg_
Проблема Функция
У меня есть функция, в которой я хочу динамически помещать столбцы регрессора в модель ARIMA с помощью пакета fable.
test_f <- function(df) {
var_names <- str_subset(names(df), "reg_") %>%
paste0(collapse = "+")
test <- enquo(var_names)
df %>%
model(ARIMA(Turnover ~ !!test))
}
test_f(df)
# A mable: 1 x 3
# Key: State, Industry [1]
State Industry `ARIMA(Turnover ~ ~"reg_test+reg_tes~
<chr> <chr> <model>
1 Victoria Food retaili~ <NULL model>
Warning message:
1 error encountered for ARIMA(Turnover ~ ~"reg_test+reg_test2")
[1] invalid model formula in ExtractVars
Я знаю, что это просто вставка строки var_names
в формулу, которая не работает, но я не могу понять, как создать var_names
таким образом, что я могу enquo()
это правильно.
Я прочитал здесь раздел Quasiquotation, я искал SO, но пока не нашел ответа.
Этот вопрос сpasre_expr()
казалось, приближался, но все еще не то, что я хотел.
Я знаю что могу использовать sym()
если у меня есть одна переменная, но я не знаю сколько reg_
там будут переменные, и я хочу включить их все.
Ожидаемый результат
Вводя переменные вручную, я могу показать ожидаемый результат.
test <- df %>%
model(ARIMA(Turnover ~ reg_test + reg_test2))
test$`ARIMA(Turnover ~ reg_test + reg_test2)`[[1]]
Series: Turnover
Model: LM w/ ARIMA(2,1,0)(0,1,2)[12] errors
Coefficients:
ar1 ar2 sma1 sma2 reg_test reg_test2
-0.6472 -0.3541 -0.4115 -0.0793 -0.0296 -0.6143
s.e. 0.0473 0.0479 0.0520 0.0446 0.5045 0.5273
sigma^2 estimated as 884.9: log likelihood=-2058.04
AIC=4130.08 AICc=4130.35 BIC=4158.5
Я также полагаю, что есть лучший способ составить формулу в ARIMA
функция. Если это поможет решить и мою проблему, это тоже сработает.
Я ценю любую помощь!
1 ответ
Возможно, вы делаете это немного сложнее, чем должно быть. Вы можете преобразовать строку в формулу, выполнивas.formula(string)
, поэтому просто создайте свою формулу в виде строки, преобразуйте ее в формулу, а затем передайте ее в ARIMA
. Вот представитель:
library(dplyr)
library(fable)
library(stringr)
df <- tsibbledata::aus_retail %>%
filter(State == "Victoria", Industry == "Food retailing") %>%
mutate(reg_test = rnorm(441, 5, 2),
reg_test2 = rnorm(441, 5, 2))
test_f <- function(df) {
var_names <- paste0(str_subset(names(df), "reg_"), collapse = " + ")
mod <- model(df, ARIMA(as.formula(paste("Turnover ~", var_names))))
unclass(mod[1, 3][[1]])[[1]]
}
test_f(df)
#> Series: Turnover
#> Model: LM w/ ARIMA(2,1,0)(0,1,1)[12] errors
#>
#> Coefficients:
#> ar1 ar2 sma1 reg_test reg_test2
#> -0.6689 -0.376 -0.4765 0.3363 1.0194
#> s.e. 0.0448 0.045 0.0426 0.4978 0.5436
#>
#> sigma^2 estimated as 883.1: log likelihood=-2058.28
#> AIC=4128.56 AICc=4128.76 BIC=4152.91
Создано 2020-04-23 пакетом REPEX (v0.3.0)