Распространение ошибок в байесовском анализе цепи Маркова
Я анализирую данные продольной панели, на которых отдельные люди переходят между разными состояниями в цепи Маркова. Я моделирую скорость перехода между состояниями, используя серию полиномиальных логистических регрессий. Это означает, что я получаю очень большое количество наклонов регрессии.
Для каждого наклона регрессии я получаю апостериорное распределение (используя WinBUGS). Из апостериорного распределения мы получаем среднее значение, стандартное отклонение и 95% вероятный интервал, связанный с рассматриваемым наклоном.
В конечном счете меня интересует ожидаемое время первого прохождения ("время удара") через цепь Маркова. Это функция всех различных переменных-предикторов, и поэтому она построена на множестве наклонов регрессии, создаваемых многочленными логистическими регрессиями.
Простой подход заключается в том, чтобы взять среднее значение каждого апостериорного распределения в качестве точечной оценки для каждого наклона регрессии и определить ожидаемое время первого прохождения для ряда различных значений переменных-предикторов. Я уже сделал это, но это может ввести в заблуждение, потому что не показывает неопределенности в отношении прогнозируемых значений ожидаемого времени первого прохождения.
Мой вопрос: как я могу рассчитать достоверный интервал для ожидаемого времени первого прохождения?
Моей первой мыслью было приблизить ошибку с помощью моделирования путем выборки отдельных значений для наклонов регрессии из каждого апостериорного распределения, получения ожидаемого времени первого прохождения с учетом этих значений, а затем построения графика стандартного отклонения всех этих смоделированных значений. Тем не менее, я чувствую, что (а) это вызвало бы крик у статистика и (б) оно не учитывает тот факт, что различные апостериорные распределения будут коррелировать (он выбирает каждое из них независимо).
В WinBUGS вы можете получить корреляции между апостериорными распределениями. Поэтому, если идея симуляции уместна, я могу теоретически смоделировать коэффициенты наклона регрессии, включающие эти корреляции.
Есть ли более прямой и менее приблизительный способ найти неопределенность? Могу ли я, например, использовать WinBUGS, чтобы найти апостериорное распределение ожидаемого времени первого прохождения для данного набора значений переменных предиктора? Скорее, как ответ на этот вопрос: определить новый узел и контролировать его. Я хотел бы представить определение серии новых узлов, каждый из которых предназначен для различного набора фактических значений предикторов, и мониторинг каждого из них. Это имеет хороший статистический смысл?
Любые мысли по этому поводу будут по достоинству оценены!