Пакет V VGAM: после добавления второй пояснительной
Почему подгонка ухудшается после добавления второй объясняющей переменной?
require("VGAM")
df = data.frame(x = c(1,2,3,4,5,6,7,8,9,10), y = c(1,4,8,15,25,36,48,65,80,105), z = c(0,0,0,1,100,400,900,1600,1800,200) )
vgt1 = vgam(y~s(x, df=2), data=df,family=gaussianff, trace=TRUE)
vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)
plot(df$x, df$y, col="black")
lines(df$x, vgt1@predictors, col="red")
lines(df$x, vgt2@predictors, col="blue")
1 ответ
Решение
Когда вы добавляете переменную, которую вы используете +
не cbind.
vgam
разбирает формулу с помощью terms.formula
искать specials = 's'
т.е. термины, которые обернуты в s
означающий сплайн.
Следовательно
vgt2 = vgam(y~s(x, df=2)+s(z, df=2), data=df,family=gaussianff, trace=TRUE)
даст вам то, что вы хотите (и это имеет меньшее отклонение, чем vgt1
).
Когда вы подходите
vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)
terms.formula
не находит specials
которые начинаются с s
, как cbind
это функция, которая идентифицирует термин в формуле. Следовательно
gam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)
является эквивалентом
gam(y~cbind(x,y), data=df,family=gaussianff, trace=TRUE)
который в терминах является эквивалентом
vgam(y~x+z, data=df,family=gaussianff, trace=TRUE)
то есть никакие сплайн-термины не установлены.