Бинарная логистическая регрессия с многократными вменяемыми данными

Я пытался работать с опциями, доступными в R (то есть MICE), чтобы выполнить бинарный логистический регрессионный анализ (с взаимодействием между непрерывными и категориальными предикторами).

Тем не менее, я изо всех сил пытаюсь провести этот простой анализ на многократных вмененных данных (подробности и воспроизводимый пример здесь).

В частности, я не смог найти способ объединить все аспекты вывода, включая эквивалент "логарифмического отношения правдоподобия", используя функцию GLM Мышей.

Чтобы избежать избыточности из предыдущего поста, я ищу ЛЮБЫЕ предложения для пакетов R или другого программного обеспечения, которые могут упростить / сделать возможным объединение всех существенных компонентов вывода для бинарной логистической регрессии (т. Е. Эквивалент критерия отношения правдоподобия модели, коэффициентов регрессии, Вальд тест). Ниже приведен пример, который мне удалось получить, используя среднеквадратичные значения для не вмененных данных (не смог найти способ выполнить это для многократных вмененных данных)

> mylogit
 Frequencies of Missing Values Due to Each Variable
 P1    ST   P8 
 18    0   31 

 Logistic Regression Model

 lrm(formula = P1 ~ ST + P8 + ST * P8, data = PS, x = TRUE, 
 y = TRUE)


 Model Likelihood     Discrimination    Rank Discrim.    
  Ratio Test           Indexes           Indexes       
  Obs           362    LR chi2     18.34    R2       0.077    C       0.652    
  0            287    d.f.            9    g        0.664    Dxy     0.304    
  1             75    Pr(> chi2) 0.0314    gr       1.943    gamma   0.311    

  max |deriv| 8e-08    gp     0.099    tau-a   0.100       Brier    0.155                     

                      Coef    S.E.   Wald Z Pr(>|Z|)
 Intercept          -0.5509 0.3388 -1.63  0.1040  
 ST=       2      -0.5688 0.4568 -1.25  0.2131  
 ST=       3      -0.7654 0.4310 -1.78  0.0757  
 ST=       4      -0.7995 0.5229 -1.53  0.1263  
 ST=       5      -1.2813 0.4276 -3.00  0.0027  
 P8                 0.2162 0.4189  0.52  0.6058  
 ST=       2 * P8 -0.1527 0.5128 -0.30  0.7659  
 ST=       3 * P8 -0.0461 0.5130 -0.09  0.9285  
 ST=       4 * P8 -0.5031 0.5635 -0.89  0.3719  
 ST=       5 * P8  0.3661 0.4734  0.77  0.4393  

В общем, мой вопрос: 1) пакет / программное обеспечение, способное обрабатывать многократные вмененные данные для выполнения традиционного бинарного логистического регрессионного анализа, особенно с термином взаимодействия 2) возможные шаги, которые мне нужно предпринять, чтобы выполнить анализ в этой программе

1 ответ

Решение

Пакет rms имеет отличные возможности для комбинирования вмененных данных с использованием fit.mult.impute() функция. Вот небольшой рабочий пример:

dat <- mtcars
## introduce NAs
dat[sample(rownames(dat), 10), "cyl"] <- NA
im <- aregImpute(~ cyl + wt + mpg + am, data = dat)
fit.mult.impute(am ~ cyl + wt + mpg, xtrans = im, data = dat, fitter = lrm)
Другие вопросы по тегам