Контрастное кодирование с использованием логистической регрессии
Я хочу сделать логистическую регрессию glm, family=binomial(link='logit')
с contr.sum
контрастное кодирование, потому что я хочу сравнить каждый уровень категориальных предикторов с большим mean
. Я использовал такое контрастное кодирование в линейном glm, но теперь я хочу использовать его и для логистической регрессии.
Однако я действительно не понимаю, что делает код, потому что в логистической регрессии нет среднего, только подсчет количества раз, когда уровень = 1 встречается в группах (зависимая переменная) 2. Так, например, как я должен интерпретировать следующий первый уровеньmanufacturer
?
data('mpg')
mpg = mpg %>% mutate(year = as.factor(year), manufacturer = as.factor(manufacturer))
mpg_glm = glm(year ~ manufacturer, data = mpg, family=binomial(link='logit'), contrasts = list(manufacturer = contr.sum))
summary(mpg_glm)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.01203 0.18065 0.067 0.947
manufacturer1 -0.01203 0.47458 -0.025 0.980
manufacturer2 0.52697 0.47819 1.102 0.270
manufacturer3 0.25990 0.35787 0.726 0.468
manufacturer4 -0.41750 0.42081 -0.992 0.321
manufacturer5 -0.23517 0.65010 -0.362 0.718
manufacturer6 0.27565 0.53424 0.516 0.606
manufacturer7 1.08658 0.78129 1.391 0.164
manufacturer8 -0.01203 0.94832 -0.013 0.990
manufacturer9 -0.70518 1.15440 -0.611 0.541
manufacturer10 -0.01203 0.94832 -0.013 0.990
manufacturer11 0.14212 0.54853 0.259 0.796
manufacturer12 -0.41750 0.86883 -0.481 0.631
manufacturer13 0.27565 0.53424 0.516 0.606
manufacturer14 -0.36871 0.37131 -0.993 0.321
Или, может быть, у кого-то есть источник / веб-сайт, на котором я могу найти эту конкретную информацию (я пытался найти что-то об этом, но это либо о логистической регрессии с нормальными контрастами, либо о кодировании контраста в линейном glm. Я не нашел веб-сайт, где бы эти 2 предмета объясняются совместно).
Заранее большое спасибо!