Может ли Tensorflow распространяться через дистрибутивы, например, бета?

tf.distributions предоставляет доступ к нескольким дистрибутивам. Моя сеть должна прогнозировать параметры функции плотности вероятности (то есть политики в моем случае), тогда потери снова зависят от них. Я хотел бы попросить о бета-дистрибутиве, особенно, потому что это тот, который я собираюсь использовать. Например:

loss=tf.distributions.Beta(concentration0,concentration1).pdf(some_value)/tf.distributions.Beta(given_concentration0.pdf(some_value), given_concentration1)*advantage
trainstep = tf.train.AdamOptimizer().minimize(loss)

Где Концентрация1 и Концентрация0 - это выход некоторой сети, которую я хочу оптимизировать (скажем, другие параметры приведены для этого вопроса). При вызове session.run (traintep) это обратное распространение в сеть? Я не могу найти никаких ресурсов с указанием того или другого.

0 ответов

Другие вопросы по тегам