Сравнение модели смешанных эффектов и комбинации двух моделей смешанных эффектов
Я надеюсь, что этот вопрос уместен здесь, потому что он касается не только проблемы кодирования, но также затрагивает некоторые теоретические вопросы, касающиеся линейных моделей со смешанными эффектами. Предположим линейную модель смешанных эффектов:
model1 <- lmer(RT ~ word_duration + RT_prev + trial + stem +
(1|Subject) + (1|Word), data = df_whole)
Я могу вычислить его показатель AIC и использовать его для сравнения модели с другими моделями. В моем случае у меня другая модель:
model2 <- lmer(RT ~ word_duration + RT_prev + trial + form +
(1|Subject) + (1|Word), data = df_subset)
Предсказания моих
model3
являются минимумом предсказаний model1 и model2 =
min[model1, model2]
. Я хотел бы сравнить
model3
с участием
model1
и я знаю, что могу использовать, например, среднеквадратичную ошибку (MSE). Однако MSE не учитывает, что
model3
представляет собой комбинацию двух моделей, и различие в MSE может не оправдывать повышение сложности. Итак, могу ли я вычислить измерение, учитывающее сложность модели, например AIC, для сравнения моделей?
Заметка:
model1
обучен на всех данных,
model2
только для подмножества. Это сделано потому, что я предполагаю, что элементы в подмножестве могут обрабатываться по-другому. Таким образом, по некоторым позициям
stem
и для других
form
является лучшим предсказателем (как обсуждается в литературе).