Сравнение модели смешанных эффектов и комбинации двух моделей смешанных эффектов

Я надеюсь, что этот вопрос уместен здесь, потому что он касается не только проблемы кодирования, но также затрагивает некоторые теоретические вопросы, касающиеся линейных моделей со смешанными эффектами. Предположим линейную модель смешанных эффектов:

model1 <- lmer(RT ~ word_duration + RT_prev + trial + stem + 
                       (1|Subject) + (1|Word), data = df_whole)

Я могу вычислить его показатель AIC и использовать его для сравнения модели с другими моделями. В моем случае у меня другая модель:

model2 <- lmer(RT ~ word_duration + RT_prev + trial + form + 
                       (1|Subject) + (1|Word), data = df_subset)

Предсказания моих model3 являются минимумом предсказаний model1 и model2 = min[model1, model2]. Я хотел бы сравнить model3 с участием model1и я знаю, что могу использовать, например, среднеквадратичную ошибку (MSE). Однако MSE не учитывает, что model3представляет собой комбинацию двух моделей, и различие в MSE может не оправдывать повышение сложности. Итак, могу ли я вычислить измерение, учитывающее сложность модели, например AIC, для сравнения моделей?

Заметка: model1 обучен на всех данных, model2только для подмножества. Это сделано потому, что я предполагаю, что элементы в подмножестве могут обрабатываться по-другому. Таким образом, по некоторым позициям stem и для других form является лучшим предсказателем (как обсуждается в литературе).

0 ответов

Другие вопросы по тегам