Регрессия и перекрестная проверка регрессии - почему разные значения p?

У меня есть вопрос R Мне интересно, почему существует разница в значениях p в исходном регрессионном анализе с использованием lm по сравнению с k-кратной перекрестной проверкой с использованием пакета DAAG.

Итак, сначала я запускаю регрессию.

Model = lm(ExampleData$DependentVariable ~ ExampleData$IV1  + ExampleData$IV2  + ExampleData$IV3  + ExampleData$IV4)

Это дает мне p-значения для предикторов (показано ниже).

(Intercept)  = 0.01958 *, ExampleData$IV1  =  0.05631 ., ExampleData$IV2  =  0.00295 **, ExampleData$IV3  =  0.00492 **, ExampleData$IV4  = 0.00473 **

Затем я перехожу к перекрестной проверке модели, используя cv.lm в пакете DAAG.

cv.lm(df=ExampleData, Model_forCV, m=5)

Это дает мне результаты перекрестной проверки вместе с p-значениями для предикторов (показано ниже).

IV1  = 0.07541 . , IV2  = 0.00059 ***, IV3  = 0.03938 * , IV4  = 0.00473 **

Почему p-значения разные?

1 ответ

Похоже, во второй модели отсутствует термин "перехват". Или это скрыто.

Отсутствующий член перехвата объяснил бы изменяющиеся p-значения. это изменит стандартную ошибку, t-значение и, следовательно, p-значение. Не говоря уже об изменении коэффициентов регрессии (как вы можете видеть в своих результатах).

Другие вопросы по тегам