Бинарная логистическая регрессия с многократными вменяемыми данными
Я пытался работать с опциями, доступными в R (то есть MICE), чтобы выполнить бинарный логистический регрессионный анализ (с взаимодействием между непрерывными и категориальными предикторами).
Тем не менее, я изо всех сил пытаюсь провести этот простой анализ на многократных вмененных данных (подробности и воспроизводимый пример здесь).
В частности, я не смог найти способ объединить все аспекты вывода, включая эквивалент "логарифмического отношения правдоподобия", используя функцию GLM Мышей.
Чтобы избежать избыточности из предыдущего поста, я ищу ЛЮБЫЕ предложения для пакетов R или другого программного обеспечения, которые могут упростить / сделать возможным объединение всех существенных компонентов вывода для бинарной логистической регрессии (т. Е. Эквивалент критерия отношения правдоподобия модели, коэффициентов регрессии, Вальд тест). Ниже приведен пример, который мне удалось получить, используя среднеквадратичные значения для не вмененных данных (не смог найти способ выполнить это для многократных вмененных данных)
> mylogit
Frequencies of Missing Values Due to Each Variable
P1 ST P8
18 0 31
Logistic Regression Model
lrm(formula = P1 ~ ST + P8 + ST * P8, data = PS, x = TRUE,
y = TRUE)
Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 362 LR chi2 18.34 R2 0.077 C 0.652
0 287 d.f. 9 g 0.664 Dxy 0.304
1 75 Pr(> chi2) 0.0314 gr 1.943 gamma 0.311
max |deriv| 8e-08 gp 0.099 tau-a 0.100 Brier 0.155
Coef S.E. Wald Z Pr(>|Z|)
Intercept -0.5509 0.3388 -1.63 0.1040
ST= 2 -0.5688 0.4568 -1.25 0.2131
ST= 3 -0.7654 0.4310 -1.78 0.0757
ST= 4 -0.7995 0.5229 -1.53 0.1263
ST= 5 -1.2813 0.4276 -3.00 0.0027
P8 0.2162 0.4189 0.52 0.6058
ST= 2 * P8 -0.1527 0.5128 -0.30 0.7659
ST= 3 * P8 -0.0461 0.5130 -0.09 0.9285
ST= 4 * P8 -0.5031 0.5635 -0.89 0.3719
ST= 5 * P8 0.3661 0.4734 0.77 0.4393
В общем, мой вопрос: 1) пакет / программное обеспечение, способное обрабатывать многократные вмененные данные для выполнения традиционного бинарного логистического регрессионного анализа, особенно с термином взаимодействия 2) возможные шаги, которые мне нужно предпринять, чтобы выполнить анализ в этой программе
1 ответ
Пакет rms имеет отличные возможности для комбинирования вмененных данных с использованием fit.mult.impute()
функция. Вот небольшой рабочий пример:
dat <- mtcars
## introduce NAs
dat[sample(rownames(dat), 10), "cyl"] <- NA
im <- aregImpute(~ cyl + wt + mpg + am, data = dat)
fit.mult.impute(am ~ cyl + wt + mpg, xtrans = im, data = dat, fitter = lrm)