R coxph() предупреждение: Loglik сходится перед переменной

У меня возникли проблемы с использованием coxph(). У меня есть две категориальные переменные: пол и вероятная причина, которые я хочу использовать в качестве переменных-предикторов. Секс - это просто типичный мужчина / женщина, но у вероятной причины есть 5 вариантов. Я не знаю, в чем проблема с предупреждением. Почему интервалы вероятности равны от 0 до Inf и значения p настолько высоки?

Вот код и вывод:

> my_coxph <- coxph(Surv(tempo,status) ~ factor(Sexo)+ factor(Causa.provavel) ,           data=ceabn)
Warning message:
In fitter(X, Y, strats, offset, init, control, weights = weights,  :
Loglik converged before variable  2,3,5,6 ; beta may be infinite. 

> summary(my_coxph)
Call:
coxph(formula = Surv(tempo, status) ~ factor(Sexo) + factor(Causa.provavel), 
data = ceabn)

n= 43, number of events= 31 

                                            coef exp(coef)  se(coef)     z Pr(>|z|)
factor(Sexo)macho                      7.254e-01 2.066e+00 4.873e-01 1.488    0.137
factor(Causa.provavel)caca             2.186e+01 3.107e+09 9.698e+03 0.002    0.998
factor(Causa.provavel)colisao linha MT 1.973e+01 3.703e+08 9.698e+03 0.002    0.998
factor(Causa.provavel)indeterminado    9.407e-01 2.562e+00 1.683e+04 0.000    1.000
factor(Causa.provavel)predacao         2.170e+01 2.655e+09 9.698e+03 0.002    0.998
factor(Causa.provavel)predado          2.276e+01 7.659e+09 9.698e+03 0.002    0.998

                                       exp(coef) exp(-coef) lower .95 upper .95
factor(Sexo)macho                      2.065e+00  4.841e-01    0.7947     5.368
factor(Causa.provavel)caca             3.107e+09  3.219e-10    0.0000       Inf
factor(Causa.provavel)colisao linha MT 3.703e+08  2.701e-09    0.0000       Inf
factor(Causa.provavel)indeterminado    2.562e+00  3.904e-01    0.0000       Inf
factor(Causa.provavel)predacao         2.655e+09  3.766e-10    0.0000       Inf
factor(Causa.provavel)predado          7.659e+09  1.306e-10    0.0000       Inf

Concordance= 0.752  (se = 0.059 )
Rsquare= 0.608   (max possible= 0.987 )
Likelihood ratio test= 40.23  on 6 df,   p=4.105e-07
Wald test            = 7.46  on 6 df,   p=0.2807
Score (logrank) test = 30.48  on 6 df,   p=3.183e-05

Спасибо

1 ответ

Решение

Когда я спросил об этом Терри Терно (автора pkg: Survival) несколько лет назад, он сказал, что тест, который запускается для создания этого предупреждения, слишком чувствительный. Как правило, предупреждение не правильно. Обычно вы можете просто посмотреть на ваши коэффициенты, чтобы увидеть, что они не бесконечны

Однако в вашем случае, кажется, правильно предупреждает вас о том, что могут быть проблемы с вашими данными, поскольку у вас невероятно большие коэффициенты. Коэффициент бета 2,276e+01 (= 22,7) в экспоненциальной модели просто смехотворно высок. Предполагаемый относительный риск составляет более миллиона! Вы должны смотреть на табличные классификации ваших данных для проблем полного разделения. У кого-нибудь из вашей контрольной группы было событие?

Другие вопросы по тегам