Нормирующая постоянная смеси распределения дирихле остается неограниченной

Question

Нормирующая постоянная смеси распределения дирихле остается неограниченной

Мне нужно рассчитать PDF-файлы смеси распределения Дирихле в Python. Но для каждого компонента смеси есть нормализующая константа, которая является обратной бета-функцией, которая имеет гамма-функцию суммы гиперпараметров в качестве числителя. Таким образом, даже для суммы гиперпараметров размера '60' она остается неограниченной. Пожалуйста, предложите мне обойти эту проблему. Что происходит, когда я игнорирую нормализующую константу?

Во-первых, проблема не в расчете самого ЧПУ. За один дирихлет у меня проблем нет. Но здесь у меня есть смесь продуктов дирихле, поэтому каждый компонент смеси является продуктом многих дирихле, каждый из которых имеет свой собственный NC. Таким образом, продукт этого остается неограниченным. Что касается моей цели, у меня есть совместное распределение p(s,T,O), где 's' является дискретным, 'T' и 'O' являются переменными Дирихле, то есть набором векторов параметров, которые суммируются с '1', Теперь, когда 's' дискретно и конечно, у меня есть |S| набор смеси продуктов из компонентов дирихле для каждого 's'. Теперь моя цель - найти p(s|T,O). Поэтому я напрямую подставляю конкретное (T,O) и вычисляю значение каждого p('s'|T,O). Для этого мне нужно рассчитать NC. Если есть только один компонент смеси, то я могу игнорировать константу нормы, calc. и наконец перенормировать, но так как у меня есть несколько компонентов смеси, каждый компонент будет иметь различное масштабирование, и поэтому я не могу перенормировать. Это моя загадка.

0

python machine-learning statistics probability dirichlet

Источник

user3443615 24 фев '15 в 06:45

1 ответ

Другие вопросы по тегам python machine-learning statistics probability dirichlet

user871096 24 фев '15 в 18:08 2015-02-24 18:08 · Answer 1 · 2015-02-24 18:08

Некоторые идеи. (1) Чтобы точно рассчитать нормирующий коэффициент, возможно, вы можете переписать гамма-функцию с помощью гаммы (a_i + 1) = a_i gamma(a_i) (a_i не обязательно должно быть целым числом, пусть базовый случай будет a_i < 1), а затем вы У вас будет сумма (a_i, i, 1, n) слагаемых в числителе и знаменателе, и вы сможете изменить их порядок, чтобы разделить наибольший член на наибольший член и умножить эти отдельные коэффициенты вместе вместо вычисления огромного числителя и огромного знаменатель и деление тех. (2) Если вам не нужно быть точным, возможно, вы можете применить приближение Стирлинга. (3) Может быть, вам не нужен PDF вообще. Для некоторых целей вам просто нужна функция, которая пропорциональна PDF. Я считаю, что цепь Маркова Монте-Карло такая. Итак, какую большую цель вы пытаетесь достичь здесь?