C-статистика и 95% доверительный интервал для модели Кокса с нестационарными ковариатами

Я выполняю регрессию Кокса с зависимой от времени ковариатой. Я особенно заинтересован в расчете 95% доверительного интервала индекса соответствия. Однако стандартное резюме модели coxph возвращает только индекс соответствия и его стандартную ошибку. Есть ли возможность получить 95% ДИ?

Спасибо!

library(survival)

temp <- subset(pbc, id <= 312, select=c(id:sex, stage))
pbc2 <- tmerge(temp, temp, id=id, death = event(time, status)) #set range
pbc2 <- tmerge(pbc2, pbcseq, id=id, ascites = tdc(day, ascites),
bili = tdc(day, bili), albumin = tdc(day, albumin),
protime = tdc(day, protime), alk.phos = tdc(day, alk.phos))
fit2 <- coxph(Surv(tstart, tstop, death==2) ~ log(bili) + log(protime), pbc2)

summary(fit2)

coxph(formula = Surv(tstart, tstop, death == 2) ~ log(bili) + 
    log(protime), data = pbc2)

  n= 1807, number of events= 125 

                 coef exp(coef) se(coef)      z Pr(>|z|)    
log(bili)     1.24121   3.45981  0.09697 12.800   <2e-16 ***
log(protime)  3.98340  53.69929  0.43589  9.139   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

             exp(coef) exp(-coef) lower .95 upper .95
log(bili)         3.46    0.28903     2.861     4.184
log(protime)     53.70    0.01862    22.853   126.181

**Concordance= 0.886  (se = 0.029 )**
Rsquare= 0.168   (max possible= 0.508 )
Likelihood ratio test= 332.1  on 2 df,   p=<2e-16
Wald test            = 263.3  on 2 df,   p=<2e-16
Score (logrank) test = 467.8  on 2 df,   p=<2e-16

Имеет ли смысл использовать функцию проверки из пакета RMS, чтобы получить 95% -й доверительный интервал для индекса C с помощью начальной загрузки? Я придумал следующий код. Как вы думаете? Однако я не уверен, как правильно обрабатывать значения Dxy из тренировочных / тестовых колонн (мне кажется, что КИ из тренировок в порядке, тогда как КИ из тестовых колонн очень узкий).

library(survival)
library(rms)
library(tidyboot)

temp <- subset(pbc, id <= 312, select=c(id:sex, stage))
pbc2 <- tmerge(temp, temp, id=id, death = event(time, status)) #set range
pbc2 <- tmerge(pbc2, pbcseq, id=id, ascites = tdc(day, ascites),
bili = tdc(day, bili), albumin = tdc(day, albumin),
protime = tdc(day, protime), alk.phos = tdc(day, alk.phos))
fit2 <- cph(Surv(tstart, tstop, death==2) ~ log(bili) + log(protime), pbc2, x=T, y=T, surv=T)
set.seed(1)
output <- capture.output(validate(fit2, method="boot", B=1000, dxy=T, pr =T))
head(output)
output <- as.matrix(output)
output_dxy <- as.matrix(output[grep('^Dxy', output[,1]),])
output_dxy <- gsub("(?<=[\\s])\\s*|^\\s+|\\s+$", "", output_dxy, perl=TRUE)
train <- abs(as.numeric(lapply(strsplit(output_dxy, split=" "), "[", 2))[1:1000])/2+0.5
test <- abs(as.numeric(lapply(strsplit(output_dxy, split=" "), "[", 3))[1:1000])/2+0.5
summary(train)
summary(test)
ci_lower(train, na.rm = FALSE)
ci_upper(train, na.rm = FALSE)
ci_lower(test, na.rm = FALSE)
ci_upper(test, na.rm = FALSE)

1 ответ

Кроме того, маловероятно, что отношения являются линейными в log bili и log protime. Сплайн-функции в журналах гарантированы.

Перед использованием оценки вероятности совпадения 0,886 необходимо проверить из R survival пакет, который

  • Оценка предназначена для обработки зависящих от времени ковариат
  • Стандартная ошибка учитывает неопределенность оценки двух коэффициентов регрессии

Если оба из них удовлетворены, вы можете получить грубый доверительный интервал 0,95 для c-индекса, используя +- 1,96 SE.

Другие вопросы по тегам