Как извлечь задние образцы логарифмического правдоподобия из PyStan?
Мне нужны задние образцы терминов вероятности бревна, чтобы запустить PSIS здесь так, чтобы
log_lik : ndarray
Array of size n x m containing n posterior samples of the log likelihood
terms :math:`p(y_i|\theta^s)`.
где маленький пример вот такой, что pip install pystan
а также
import pystan
schools_code = """
data {
int<lower=0> J; // number of schools
real y[J]; // estimated treatment effects
real<lower=0> sigma[J]; // s.e. of effect estimates
}
parameters {
real mu;
real<lower=0> tau;
real eta[J];
}
transformed parameters {
real theta[J];
for (j in 1:J)
theta[j] = mu + tau * eta[j];
}
model {
eta ~ normal(0, 1);
y ~ normal(theta, sigma);
}
"""
schools_dat = {'J': 8,
'y': [28, 8, -3, 7, -1, 1, 18, 12],
'sigma': [15, 10, 16, 11, 9, 11, 10, 18]}
sm = pystan.StanModel(model_code=schools_code)
fit = sm.sampling(data=schools_dat, iter=1000, chains=4)
Как я могу получить последующие образцы логарифмического правдоподобия модели PyStan?
2 ответа
Решение
Вы можете получить последующие образцы логарифмического правдоподобия, выполнив: logp = fit.extract()['lp__']
Я полагаю, что правильный способ вычисления логарифмической вероятности в этом случае следующий:
generated quantities {
vector[J] log_lik;
for (i in 1:J)
log_lik[i] = normal_lpdf(y[i] | theta, sigma);
}
После этого вы можете запустить psis:
loo, loos, ks = psisloo(fit['log_lik'])
print('PSIS-LOO value: {:.2f}'.format(loo))
Полный код станет таким:
import pystan
from psis import psisloo
schools_code = """
data {
int<lower=0> J; // number of schools
real y[J]; // estimated treatment effects
real<lower=0> sigma[J]; // s.e. of effect estimates
}
parameters {
real mu;
real<lower=0> tau;
real eta[J];
}
transformed parameters {
real theta[J];
for (j in 1:J)
theta[j] = mu + tau * eta[j];
}
model {
eta ~ normal(0, 1);
y ~ normal(theta, sigma);
}
generated quantities {
vector[J] log_lik;
for (i in 1:J)
log_lik[i] = normal_lpdf(y[i] | theta, sigma);
}
"""
schools_dat = {'J': 8,
'y': [28, 8, -3, 7, -1, 1, 18, 12],
'sigma': [15, 10, 16, 11, 9, 11, 10, 18]}
sm = pystan.StanModel(model_code=schools_code)
fit = sm.sampling(data=schools_dat, iter=1000, chains=4)
loo, loos, ks = psisloo(fit['log_lik'])
print('PSIS-LOO value: {:.2f}'.format(loo))