Как мне добавить коэффициенты, SE, доверительные интервалы и отношения шансов в таблице Stargazer?

Предыдущий пользователь спросил, как мне добавить доверительные интервалы к коэффициентам шансов в таблице Stargazer? и наметил четкое решение проблемы.

В настоящее время я печатаю свои таблицы вручную, и это занимает очень много времени. пример моей распечатанной таблицы. Вот ссылка на используемый файл.txt.

Моя модель имеет размер в качестве зависимой переменной (категориальная) и пол (категориальная), возраст (непрерывный) и год (непрерывный) в качестве независимых переменных. я использую mlogit моделировать отношения между переменными.

Код, который я использовал для модели, выглядит следующим образом:

tattoo <- read.table("https://ndownloader.figshare.com/files/6920972", 
                      header=TRUE, na.strings=c("unk", "NA"))    

library(mlogit)

Tat<-mlogit.data(tattoo, varying=NULL, shape="wide", choice="size", id.var="date")

ml.Tat<-mlogit(size~1|age+sex+yy, Tat, reflevel="small", id.var="date")

library(stargazer)

OR.vector<-exp(ml.Tat$coef)
CI.vector<-exp(confint(ml.Tat))
p.values<-summary(ml.Tat)$CoefTable[,4]

#table with odds ratios and confidence intervals
stargazer(ml.Tat, coef=list(OR.vector), ci=TRUE, ci.custom=list(CI.vector), single.row=T, type="text", star.cutoffs=c(0.05,0.01,0.001), out="table1.txt", digits=4)

#table with coefficients and standard errors
stargazer(ml.Tat, type="text", single.row=TRUE, star.cutoffs=c(0.05,0.01,0.001), out="table1.txt", digits=4) 

stargazer код, который я пробовал, показан ниже для небольшой части моих данных:

library(stargazer)
OR.vector<-exp(ml.Tat$coef)
CI.vector<-exp(confint(ml.Tat))
p.values<-summary(ml.Tat)$CoefTable[,4] #incorrect # of dimensions, unsure how to determine dimensions
stargazer(ml.Tat, coef=list(OR.vector), ci=TRUE, ci.custom=list(CI.vector), single.row=T, type="text", star.cutoffs=c(0.05,0.01,0.001), out="table1.txt", digits=4) #gives odds ratio (2.5%CI, 97.5%CI)

Соотношение шансов и доверительный интервал вывода: шансы и CI

stargazer(ml.Tat, type="text", single.row=TRUE, star.cutoffs=c(0.05,0.01,0.001), out="table1.txt", digits=4) #gives coeff (SE)`

Коэффициент и выход SE: коэффициент и выход SE

Я могу комбинировать отношения шансов с доверительными интервалами или стандартными ошибками или коэффициентами с доверительными интервалами и стандартными ошибками, но когда я пишу все три вместе, ci=TRUE Кажется, функция перезаписывает SE по умолчанию.

Для моей диссертации мне нужны таблицы, чтобы показать коэффициенты, стандартные ошибки, доверительные интервалы и отношения шансов (и p-значения в некотором формате). Есть ли способ для Stargazer включить все четыре вещи? Возможно в двух разных колонках? Я могу экспортировать таблицы в Excel, но без всех четырех вещей в одной таблице Stargazer я застрял, вручную сложив две таблицы выше. Это не имеет большого значения для 1 таблицы, но я работаю с 36 моделями, для которых всем нужны таблицы (для моей диссертации).

Как я могу использовать Stargazer, чтобы показать все четыре вещи? (отношение шансов, доверительные интервалы, коэффициенты и стандартные ошибки)

2 ответа

Решение

Stargazer принимает несколько моделей и добавляет каждую в новую строку. Таким образом, вы можете сделать вторую модель и заменить стандартные коэффициенты отношениями шансов и передать это stargazer вызов.

tattoo <- read.table("https://ndownloader.figshare.com/files/6920972", 
                  header=TRUE, na.strings=c("unk", "NA"))    

library(mlogit)

Tat<-mlogit.data(tattoo, varying=NULL, shape="wide", choice="size", id.var="date")

ml.Tat<-mlogit(size~1|age+sex+yy, Tat, reflevel="small", id.var="date")
ml.TatOR<-mlogit(size~1|age+sex+yy, Tat, reflevel="small", id.var="date")
ml.TatOR$coefficients <- exp(ml.TatOR$coefficients) #replace coefficents with odds ratios

library(stargazer)
stargazer(ml.Tat, ml.TatOR, ci=c(F,T),column.labels=c("coefficients","odds ratio"),
          type="text",single.row=TRUE, star.cutoffs=c(0.05,0.01,0.001),
          out="table1.txt", digits=4)

Аргумент ci=c(F,T) подавляет доверительный интервал в первом столбце (вместо этого отображаются SE) и показывает его во втором столбце. column.labels Аргумент позволяет вам назвать столбцы.

====================================================================
                                  Dependent variable:               
                   -------------------------------------------------
                                         size                       
                        coefficients              odds ratio        
                            (1)                      (2)            
--------------------------------------------------------------------
large:(intercept)  -444.6032*** (22.1015) 0.0000 (-43.3181, 43.3181)
medium:(intercept) -187.9871*** (11.9584) 0.0000 (-23.4381, 23.4381)
large:age            0.0251*** (0.0041)   1.0254*** (1.0174, 1.0334)
medium:age           0.0080** (0.0026)    1.0081*** (1.0030, 1.0131)
large:sexM           1.3818*** (0.0607)   3.9821*** (3.8632, 4.1011)
medium:sexM          0.7365*** (0.0330)   2.0886*** (2.0239, 2.1534)
large:yy             0.2195*** (0.0110)   1.2455*** (1.2239, 1.2670)
medium:yy            0.0931*** (0.0059)   1.0976*** (1.0859, 1.1093)
--------------------------------------------------------------------
Observations               18,162                   18,162          
R2                         0.0410                   0.0410          
Log Likelihood          -15,882.7000             -15,882.7000       
LR Test (df = 8)       1,357.1140***            1,357.1140***        
====================================================================
Note:                                  *p<0.05; **p<0.01; ***p<0.001

Попытка извлечь эти значения из Stargazer будет болезненным. Возвращаемое значение от вызовов stargazer - просто символьные строки. Вместо этого вы должны посмотреть на структуру модели. Это напоминает структуру glm Результаты:

> names(ml.Tat)
 [1] "coefficients"  "logLik"        "gradient"      "hessian"      
 [5] "est.stat"      "fitted.values" "probabilities" "residuals"    
 [9] "omega"         "rpar"          "nests"         "model"        
[13] "freq"          "formula"       "call"      

И результаты summary.mlogit напоминают результаты summary.glm:

> names(summary(ml.Tat))
 [1] "coefficients"  "logLik"        "gradient"      "hessian"      
 [5] "est.stat"      "fitted.values" "probabilities" "residuals"    
 [9] "omega"         "rpar"          "nests"         "model"        
[13] "freq"          "formula"       "call"          "CoefTable"    
[17] "lratio"        "mfR2"         

Так что вы должны использовать [['CoefTable']] значения, которые, скорее всего, представлены в виде матрицы... поскольку они должны быть аналогичны значению суммарных (mod)$ коэффициентов.

> summary(ml.Tat)$CoefTable
                        Estimate   Std. Error     t-value     Pr(>|t|)
large:(intercept)  -444.39366673 2.209599e+01 -20.1119625 0.000000e+00
medium:(intercept) -187.91353927 1.195601e+01 -15.7170716 0.000000e+00
unk:(intercept)     117.92620950 2.597647e+02   0.4539731 6.498482e-01
large:age             0.02508481 4.088134e-03   6.1360059 8.462202e-10
medium:age            0.00804593 2.567671e-03   3.1335519 1.727044e-03
unk:age               0.01841371 4.888656e-02   0.3766620 7.064248e-01
large:sexM            1.38163894 6.068763e-02  22.7663996 0.000000e+00
medium:sexM           0.73646230 3.304341e-02  22.2877210 0.000000e+00
unk:sexM              1.27203654 7.208632e-01   1.7646018 7.763071e-02
large:yy              0.21941592 1.098606e-02  19.9722079 0.000000e+00
medium:yy             0.09308689 5.947246e-03  15.6521007 0.000000e+00
unk:yy               -0.06266765 1.292543e-01  -0.4848399 6.277899e-01

Теперь должен быть ясен способ выполнить домашнее задание.

Другие вопросы по тегам