mgcv: как использовать аргумент "исключить" в предикате.gam?

У меня есть модель, структурированная следующим образом, и я хотел бы извлечь прогнозируемые значения, игнорируя при этом случайный эффект. Как указано в ?predict.gam и здесь я использую exclude аргумент, но я получаю ошибку. Где моя ошибка?

dt <- data.frame(n1 = runif(500, min=0, max=1),
             n2 = rep(1:10,50), 
             n3 = runif(500, min=0, max=2),
             n4 = runif(500, min=0, max=2),
             c1 = factor(rep(c("X","Y"),250)),
             c2 = factor(rep(c("a", "b", "c", "d", "e"), 100)))

mod = gam(n1 ~ 
           s(n2, n3, n4, by=c1) +
           s(c2, bs="re"),
         data=dt)

newd=data.table(expand.grid(n1=seq(min(dt$n1), max(dt$n1), 0.5), 
                        n2=1:10,
                        n3=seq(min(dt$n3), max(dt$n3), 0.5),
                        n4=seq(min(dt$n4), max(dt$n4), 0.5),
                        c1=c("X", "Y")))
newd$pred <- predict.gam(mod, newd, exclude = "s(c2)")

In predict.gam(mod, newd, exclude = "s(c2)"): not all required variables have been supplied in  newdata! 

1 ответ

Решение

exclude не работает так, как вы предполагали. Вам все еще нужно предоставить все переменные в вашем newd за predict.gam, Смотрите мой этот ответ для того, что позади predict.gam,

Вот что вам нужно сделать:

## pad newd with an arbitrary value for variable c2
newd$c2 <- "a"
## termwise prediction
pt <- predict.gam(mod, newd, type = "terms", exclude = "s(c2)")
## linear predictor without random effect
lp_no_c2 <- rowSums(pt) + attr(pt, "constant")
Другие вопросы по тегам