fable::model() передает списки внешних регрессоров в ARIMA()

Я хотел бы передать список моделей с различными внешними регрессорами модели ARIMA в fable::model(). В конечном итоге я хотел бы передать все возможные комбинации нескольких (до 10) внешних переменных в ARIMA().

На примере данных о семейном бюджете США

library(tidyverse)
library(tsibble)
library(tsibbledata)
library(fable)
library(forecast)

aus <- hh_budget %>% 
  filter(Country == "Australia") %>% 
  select(-Country)

Я хотел бы сделать следующее без явного написания формулы модели

fit1 <- aus %>% 
  model(arima = ARIMA(Debt ~ DI))

fit2 <- aus %>% 
  model(arima = ARIMA(Debt ~ DI + Expenditure))

fit3 <- aus %>% 
  model(arima = ARIMA(Debt ~ DI + Expenditure + Savings))

Я не могу заставить модель (arima = ARIMA()) работать с изменяющейся формулой.

Простой пример

target <- "Debt"
xregs <- paste0(names(aus)[3:4], collapse = " + ") %>% noquote()

fit2 <- aus %>% 
  model(arima = ARIMA(target ~ xregs))

Пример сопоставленного списка

# Build lists of external regressor combinations

subsets_list <- function(set, subset_size) {
  combn(set, subset_size) %>%
    BBmisc::convertColsToList() %>%
    unname()
}

xregs <-
  map(.x = 1:(length(aus) - 2), .f = subsets_list, 
      set = colnames(aus[3:length(aus)])) %>% 
  unlist(recursive = F)


model_arima <- function(tsibble, target, xregs){
  model(arima = ARIMA(y = tsibble[, target], 
                      xreg = tsibble[, xregs], 
                      lambda = "auto"))
}

fit <- map(.x = xregs, 
           .f = model_arima, 
           tsibble = aus, 
           target = target)

Вот как я это сделал в прогнозе::auto.arima()

aus_ts <- aus %>% 
  as_tibble(.) %>% 
  select(-Year) %>% 
  ts(., start = 1995, frequency = 1)

auto_arima <- function(ts, target, xregs){
auto.arima(y = ts[, target], 
           xreg = ts[, xregs], 
           lambda = "auto")
}

fit <- map(.x = xregs, .f = auto_arima, ts = aus_ts, target = target)

1 ответ

Решение

Вы можете создавать формулы программно разными способами. Самый простой - использоватьas.formula():

library(tidyverse)
library(fable)
aus <- tsibbledata::hh_budget %>% 
  filter(Country == "Australia") %>% 
  select(-Country)

target <- "Debt"
xregs <- paste0(names(aus)[3:4], collapse = " + ")
as.formula(paste(target, xregs, sep ="~"))
#> Debt ~ DI + Expenditure

Создано 2020-07-03 пакетом REPEX (v0.3.0)

При использовании этого подхода используется синтаксический анализатор, который имеет ограничения для нестандартных имен переменных. Для более точного построения формул можно использоватьrlang::new_formula().

Чтобы оценить желаемый набор моделей, вы можете использовать:

# Load libraries
library(tidyverse)
library(fable)

# Prepare data
aus <- tsibbledata::hh_budget %>% 
  filter(Country == "Australia") %>% 
  select(-Country)

# Construct formulas
xregs <- c("DI", "Expenditure", "Savings")
rhs <- map_chr(seq_along(xregs), ~ paste(xregs[seq_len(.)], collapse = " + "))
lhs <- "Debt"
formulas <- map(paste(lhs, rhs, sep = " ~ "), as.formula)

# Create model specifications
model_specs <- set_names(map(formulas, ARIMA), formulas)

# Estimate models
aus %>% 
  model(!!!model_specs)
#> # A mable: 1 x 3
#>                   `Debt ~ DI`   `Debt ~ DI + Expenditure`
#>                       <model>                     <model>
#> 1 <LM w/ ARIMA(1,1,0) errors> <LM w/ ARIMA(1,1,0) errors>
#> # … with 1 more variable: `Debt ~ DI + Expenditure + Savings` <model>

Создано 2020-07-03 пакетом REPEX (v0.3.0)

Другие вопросы по тегам