Регрессия и перекрестная проверка регрессии - почему разные значения p?
У меня есть вопрос R Мне интересно, почему существует разница в значениях p в исходном регрессионном анализе с использованием lm по сравнению с k-кратной перекрестной проверкой с использованием пакета DAAG.
Итак, сначала я запускаю регрессию.
Model = lm(ExampleData$DependentVariable ~ ExampleData$IV1 + ExampleData$IV2 + ExampleData$IV3 + ExampleData$IV4)
Это дает мне p-значения для предикторов (показано ниже).
(Intercept) = 0.01958 *, ExampleData$IV1 = 0.05631 ., ExampleData$IV2 = 0.00295 **, ExampleData$IV3 = 0.00492 **, ExampleData$IV4 = 0.00473 **
Затем я перехожу к перекрестной проверке модели, используя cv.lm в пакете DAAG.
cv.lm(df=ExampleData, Model_forCV, m=5)
Это дает мне результаты перекрестной проверки вместе с p-значениями для предикторов (показано ниже).
IV1 = 0.07541 . , IV2 = 0.00059 ***, IV3 = 0.03938 * , IV4 = 0.00473 **
Почему p-значения разные?
1 ответ
Похоже, во второй модели отсутствует термин "перехват". Или это скрыто.
Отсутствующий член перехвата объяснил бы изменяющиеся p-значения. это изменит стандартную ошибку, t-значение и, следовательно, p-значение. Не говоря уже об изменении коэффициентов регрессии (как вы можете видеть в своих результатах).