Задние интервалы неопределенности Pystan

Question

Задние интервалы неопределенности Pystan

Я видел на другом форуме, что PyStan не имеет той же функции, что и RStan, где они используют posterior_interval(), но мы можем использовать numpy.percentile() вместо. Я в настоящее время использую pystan.StanModel.optimizing() функция в PyStan, чтобы получить набор параметров, которые максимизируют апостериорную вероятность. Теперь я также хотел бы получить внешний 95% доверительный интервал для последующего результата, поэтому мне интересно, numpy.percentile() функция будет использоваться с optimizing функционировать?

Я попытался найти 95% интервал распределения параметров, но это не дало хорошего доверительного интервала вокруг результата. В частности, я не считаю это хорошим, так как, когда я ожидаю, что апостериорный представит мультимодальное распределение, доверительный интервал, который я провожу, используя numpy.percentile() находится внутри задней 2-D гауссовой нашивки.

Я думаю, 95-процентный интервал должен быть взят сзади. Буду ли я использовать функцию процентиля с оптимизирующей функцией для получения 95% уверенного апостериорного результата?

4

python optimization confidence-interval uncertainty pystan

Источник

user10627118 05 дек '18 в 16:24

2 ответа

Решение

Вы можете получить процентили вы хотите прямо из pystan.stansummary:

percentiles = (0.025, 0.25, 0.5, 0.75, 0.975)              # edit these at will
pystan.stansummary(fit=your_fit, probs=percentiles, digits_summary=2)

Это должно работать нормально.

3

Источник

user4588467 21 янв '19 в 13:20

Другие вопросы по тегам python optimization confidence-interval uncertainty pystan

user570918 11 дек '18 в 23:46 2018-12-11 23:46 · Accepted Answer · 2018-12-11 23:46

Для получения оценок по апостериорным оценкам требуется выборка апостериорных, которая pystan.StanModel.optimizing не делает. Вместо этого используйте pystan.StanModel.sampling Метод генерации MCMC рисует сзади.

Если вам просто нужны показания стандартных доверительных границ, то pystan.StanFit.stansummary() Метод может быть достаточным, так как для каждого параметра будет напечатан квантиль 2,5%, 25%, 50%, 75% и 97,5%. Например,

fit = sm.sampling(...) # eight schools model
print(fit.stansummary())

Inference for Stan model: anon_model_19a09b474d1901f191444eaf8a6b8ce2.
4 chains, each with iter=10000; warmup=5000; thin=1;  post-warmup
draws per chain=5000, total post-warmup draws=20000.

           mean se_mean     sd   2.5%    25%    50%   75%  97.5%   n_eff   Rhat 
mu         7.98    0.05   5.04   -2.0   4.76   7.91  11.2   18.2   10614    1.0 
tau        6.54    0.08   5.65   0.24   2.49   5.25   8.98  20.65   4552    1.0 
eta[0]     0.39  6.7e-3   0.94  -1.53  -0.23   0.42   1.02   2.18  20000    1.0 
eta[1]   3.3e-4  6.2e-3   0.88  -1.74  -0.58-2.5e-3   0.57   1.75  20000    1.0 
eta[2]     -0.2  6.6e-3   0.93  -2.01  -0.84  -0.22   0.41   1.68  20000    1.0 
eta[3]    -0.03  6.3e-3   0.89   -1.8  -0.61  -0.03   0.56   1.75  20000    1.0 
eta[4]    -0.35  6.7e-3   0.88  -2.04  -0.94  -0.36   0.22   1.44  17344    1.0 
eta[5]    -0.22  6.6e-3    0.9  -1.96  -0.81  -0.24   0.35   1.59  18298    1.0 
eta[6]     0.34  6.8e-3   0.88  -1.43  -0.23   0.36   0.93   2.04  16644    1.0 
eta[7]     0.05  6.6e-3   0.93  -1.77  -0.58   0.04   0.66   1.88  20000    1.0 
theta[0]   11.4    0.07   8.23  -1.83   6.04  10.22  15.42  31.52  13699    1.0 
theta[1]   7.93    0.04   6.21  -4.58   4.09   7.89  11.79  20.48  20000    1.0 
theta[2]   6.17    0.06   7.72 -11.43   2.06   6.65  10.85  20.53  16367    1.0 
theta[3]   7.72    0.05   6.53  -5.29   3.68    7.7  11.75  21.04  20000    1.0 
theta[4]   5.14    0.04   6.35  -9.35   1.44   5.64   9.38  16.49  20000    1.0 
theta[5]   6.11    0.05   6.66  -8.44   2.22   6.44  10.41  18.52  20000    1.0 
theta[6]  10.63    0.05   6.76  -1.25   6.04  10.08  14.51  25.66  20000    1.0 
theta[7]    8.4    0.06   7.85  -7.56   3.89   8.17  12.76   25.3  16584    1.0 
lp__      -4.89    0.04   2.63 -10.79  -6.47  -4.66  -3.01  -0.43   5355    1.0

Или, если вам нужны конкретные квантили, вы бы использовали numpy.percentile как вы упомянули.

Однако, как вы правильно заметили, это не подходит для мультимодальных дистрибутивов. Этот случай рассматривается в другом ответе, но имейте в виду, что, если априори ожидается множество режимов, обычно используется смешанная модель для разделения режимов на отдельные унимодальные случайные величины.