Вложенные случайные эффекты и связанные фиксированные эффекты
У меня есть данные по международным группам, и я хотел бы знать влияние IV
на двоичном исходе уровня студента DV
Я хотел бы включить вложенный случайный эффект, который учитывает то, в какой школе учится учащийся, что повлияет на результат, и что школы существенно различаются по странам: (1|country/school)
, Итак, модель, с которой я начал:
model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')
Я также хотел бы принять во внимание временные тенденции. Сначала я подумал, что должен добиться фиксированных результатов в течение года, но политические события в этих странах со временем значительно различаются, и я хотел уловить, что, хотя 1991 год, возможно, оставил школы в стране А в суматохе, 1991 год мог бы стать отличным годом для финансирования образования. в стране B. Таким образом, я подумал, что, возможно, мне следует включить фиксированный эффект по году в стране, как показано ниже:
model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')
Случайные эффекты для модели:
Random effects:
Groups Name Variance Std.Dev.
school:country (Intercept) 5.703e-02 2.388e-01
country (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups: school:country, 51; country, 22
Неправильно ли включать фиксированные эффекты по годам, когда в модель уже включен случайный эффект по стране?
Альтернативный способ задать вопрос: как мне, вероятно, иметь дело с тем, что school
это подмножество country
, а также country_year
это подмножество country
, но ни school
или же country_year
являются подмножествами друг друга?
1 ответ
Из того, что я вижу, у вас есть 22 страны. Не понятно что country_year
есть, но при условии, что это просто манекен для country:year
тогда, возможно, не стоит включать это как фиксированный эффект (как фактор), так как уровней будет слишком много, чтобы их можно было интерпретировать с пользой.
Поскольку вас интересуют временные тенденции, имеет смысл включить year
как фиксированный эффект:
DV ~ IV + (1|country/school) + as.factor(year)
Если есть много years
Вы можете найти это лучше включать год как числовой
DV ~ IV + (1|country/school) + as.numeric(year)
... так как это будет оценивать единую (линейную) тенденцию за год, тогда как, если это будет фактор, тогда будет вычисляться оценка, сколько бы лет не было (минус 1), что будет нелегко интерпретировать, когда существует много уровней. Однако при кодировании в качестве коэффициента оценки могут указывать на наличие нелинейного тренда, и тогда вы можете переключиться на as.numeric
и ввести нелинейные условия.
Последний абзац ОП немного сбивает с толку. Если country_year
действительно вложен в country
тогда бы мы имели:
DV ~ IV + (1|country/school) + (1|country:country_year)
.. что такое же как:
DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)
... однако это не будет оценивать какую-либо временную тенденцию. Если вы хотите оценить тренд, вам нужно включить year
(или же country_year
) как фиксированный эффект, как упомянуто выше, - и вы можете разрешить это различие между школами (и / или странами), включив его в качестве случайного наклона, например:
DV ~ IV + year + (1|country) + (year|school:country)