Примерка смешанной модели
Я хочу подобрать смешанную модель для рассмотрения вариаций между регионами в случаях заболевания с первым уровнем, находящимся в почтовом индексе, и вторым уровнем в качестве региона, использующим регрессию Пуассона с ковариатами, являющимися максимальными темпами, средними темпами, минимальными темпами. У меня есть 3 региона, закодированные как Region.Coding. Любая помощь для начала с использованием переменной с использованием фрейма данных ниже:
Postcode Region.Coding maxtemp meantemp mintemp Cases2011
YO7 4DH 1 13.45 9.75 6.05 50
YO62 7JL 1 13.45 9.75 6.05 0
YO62 6RW 1 13.45 9.75 6.05 10
YO62 5HX 1 13.45 9.75 6.05 0
TN27 0DA 2 15.32 11.22 7.13 98
TN26 3TF 2 15.32 11.22 7.13 0
TN26 3EU 2 15.32 11.22 7.13 30
TN25 6AS 2 15.32 11.22 7.13 0
TN25 5PD 2 15.32 11.22 7.13 28
TR7 3HU 3 14.17 10.6 7.06 115
TR27 5EF 3 14.17 10.6 7.06 0
TR10 9DL 3 14.17 10.6 7.06 0
TQ9 7LN 3 14.17 10.6 7.06 23
TQ9 6NQ 3 14.17 10.6 7.06 50
1 ответ
Что-то вроде:
library(lme4)
glmer(Cases2011 ~ maxtemp+mintemp+meantemp + (1|Region.Coding/PostCode),
family=poisson, data=mydata)
... однако я бы не советовал устанавливать категориальную переменную только тремя уровнями (Region.Coding
) как случайный, так что попробуйте
glmer(Cases2011 ~ maxtemp+mintemp+meantemp + Region.Coding +
(1|PostCode),
family=poisson, data=mydata)
предполагая, что почтовые индексы уникальны (то есть, один и тот же почтовый индекс не встречается в двух разных регионах).
Не забудьте проверить наличие избыточной дисперсии!
В зависимости от того, сколько у вас данных, вы можете разрешить взаимодействие между температурными переменными и вашими регионами (например, mintemp:Region.Coding
или же (mintemp|PostCode)
,