anova.mer Mod(mod_null, mod_eins): модели не были все приспособлены к одному и тому же размеру набора данных

Я видел, что у некоторых ребят тоже была эта проблема, но я действительно не понимал данных ответов.

Я сделал несколько линейных смешанных моделей, начиная с модели "только перехват". Впоследствии я хотел добавить больше переменных. Когда я пытался сравнивать модели, выводом было то, что "модели не все были приспособлены к одному и тому же размеру набора данных". Что мне нужно сделать, чтобы данные соответствовали одному и тому же набору данных?

Синтаксис R:

mod_zero <- lmer(quality ~ 1 + (1|subject_id))
summary(mod_zero)
mod_one <- lmer(quality ~ ps + an + int + ch + boredom + (1|subject_id),dat)
summary(mod_one)
anova(mod_zero, mod_one)

Добавление na.rm=T не помогло. У кого-нибудь есть идея?

1 ответ

Решение

Ошибка, вероятно, вызвана наличием отсутствующих данных в одном или нескольких предикторах во второй модели. Эти наблюдения удаляются из второй модели (создавая тем самым другой набор данных, который является подмножеством исходных данных), и вы не сможете осмысленно сравнить две модели, которые подходят для разных наборов данных. Чтобы сравнить обе модели, вам нужно будет подогнать первую модель к набору данных, не пропуская данные о ps, an, int, ch, скуке. Пытаться:

dat2 <- dat[which(complete.cases(dat[,c('ps', 'an', 'int', 'ch', 'boredom')])),]

mod_zero <- lmer(quality ~ 1 + (1|subject_id), dat2)
mod_one <- lmer(quality ~ ps + an + int + ch + boredom + (1|subject_id),dat2) 

anova(mod_zero, mod_one) 

Это решает ошибку, но вы должны спросить себя, почему отсутствуют данные. Удаление отсутствующих данных может повлиять на ваши результаты в зависимости от механизма отсутствующих данных. Если у вас есть много пропущенных данных, которые систематически связаны с вашей конечной переменной, это сместит ваши оценки модели, и вам нужно будет искать способы уменьшения этого смещения (например, многократное вменение). Грэм написал много книг и статей, в которых объясняются различные недостающие механизмы данных и решения. Сравнивая вывод mod_zero на dat а также dat2 может дать первое указание на возможное смещение (хотя аналогичный вывод не гарантирует отсутствие смещения).

Другие вопросы по тегам