Как сравнить два гиперпараметра в иерархической модели?
В одной иерархической модели у нас есть два параметра: dnorm (A_mu
, 0,25^-2) и днорм (B_mu
0,25^-2). В этом случае 0,25 является SD, я использую фиксированное число. A_mu
а также B_mu
представляют среднее на уровне группы. После подгонки данных rjags
, мы получаем распределения для каждого параметра. Поэтому я просто сравниваю самый высокий задний интервал плотности (ИЧР) A_mu
а также B_mu
? Нужно ли что-то вычислять, используя SD (0,25)?
В другом случае, если sd двух гиперпараметров не фиксирован, например: dnorm (A_mu
, A_sd
) и dnorm (B_mu
, B_sd
). Как я могу сравнить два гиперпараметра и принять решение, например, эта группа значительно отличается от другой группы?
1 ответ
Помните, что вы получаете апостериорные дистрибутивы для A_mu и B_mu. Это облегчает сравнение, так как вы можете посмотреть 95-процентные доверительные интервалы (CI) для параметров (или выбрать доверительное значение, которое удовлетворяет вашим потребностям). Я полагаю, что JAGS использует выборку Гиббса, поэтому вы сможете получить необработанные сэмплы от авторов для A_mu и B_mu. Затем вы можете спросить "какова вероятность того, что B_mu больше некоторого значения?" путем расчета процента задних образцов, которые превышают это значение. В качестве альтернативы и аналогично частому тестированию гипотез, вы можете спросить, какова вероятность того, что среднее значение B_mu является ничьей с задней стороны A_mu. Таким образом, ключ заключается в том, чтобы просто использовать образцы из вашего апостериорного. Я бы порекомендовал взглянуть на учебник Эндрю Гельмана по BDA3 (глава 4), чтобы получить действительно хорошее представление об этих концепциях.
Несколько вещей, которые следует иметь в виду, прежде чем делать выводы из данных: (1) вы всегда должны проверять достоверность своих цепей Маркова, оценивая такие вещи, как автокорреляция (2) пытаться выполнить апостериорную прогностическую проверку, чтобы убедиться, что ваша модель хорошо подходит к данным. Если ваша модель плохо вписывается в данные, вы можете получить очень вводящие в заблуждение результаты описанной выше процедуры.