Отрицательные значения неотрицательного параметра в вероятности тензорного потока
Я пытаюсь вписать простую модель Дирихле-Мультома в вероятность тензорного потока. Параметры концентрации gamma
и я положил гамма (1,1) до их распространения. Это модель, где S - количество категорий, а N - количество выборок:
def dirichlet_model(S, N):
gamma = ed.Gamma(tf.ones(S)*1.0, tf.ones(S)*1.0, name='gamma')
y = ed.DirichletMultinomial(total_count=500., concentration=gamma, sample_shape=(N), name='y')
return y
log_joint = ed.make_log_joint_fn(dirichlet_model)
Тем не менее, когда я пытаюсь сделать выборку из этого с использованием HMC, коэффициент приемки равен нулю, и начальное извлечение для gamma
содержит отрицательные значения. Я делаю что-то неправильно? Не должны ли отрицательные предложения по параметрам концентрации автоматически отклоняться? Ниже мой пример кода:
def target_log_prob_fn(gamma):
"""Unnormalized target density as a function of states."""
return log_joint(
S=S, N=N,
gamma=gamma,
y=y_new)
num_results = 5000
num_burnin_steps = 3000
states, kernel_results = tfp.mcmc.sample_chain(
num_results=num_results,
num_burnin_steps=num_burnin_steps,
current_state=[
tf.ones([5], name='init_gamma')*5,
],
kernel=tfp.mcmc.HamiltonianMonteCarlo(
target_log_prob_fn=target_log_prob_fn,
step_size=0.4,
num_leapfrog_steps=3))
gamma = states
with tf.Session() as sess:
[
gamma_,
is_accepted_,
] = sess.run([
gamma,
kernel_results.is_accepted,
])
num_accepted = np.sum(is_accepted_)
print('Acceptance rate: {}'.format(num_accepted / num_results))
1 ответ
Попробуйте уменьшить размер шага, чтобы увеличить скорость приема. Оптимальный коэффициент приема для HMC составляет около 0,651 ( https://arxiv.org/abs/1001.4460). Не уверен, почему вы видите отрицательные значения. Может быть, ошибка с плавающей точкой около нуля? Можете ли вы опубликовать некоторые из журналов вашего пробежки?