Как рассчитать вероятный регион 95 для совместного распределения 2D?

Предположим, у нас есть совместное распределение p(x_1,x_2), и мы знаем x_1,x_2,p. Оба дискретны, (x_1,x_2) - разброс, его контур можно нарисовать, а также маргинальный. Я хотел бы показать область 95% квантиля (будет содержаться шкала 95% данных) совместного распределения, как я могу это сделать?

2 ответа

Как указывают другие, решения этой проблемы бесконечно много. Практическим является поиск приблизительного центра облака точек и расширение круга оттуда до тех пор, пока он не будет содержать приблизительно 95% данных. Затем найдите выпуклую оболочку выбранных точек и вычислите ее площадь.

Конечно, это будет работать, только если данные сконцентрированы в одной области. Это не будет работать, если есть несколько кластеров.

Если вы заинтересованы в нахождении пары x_1, x_2 действительных чисел, такой что P(X_1<=x_1, X_2<=x_2) = 0,95 и ваше распределение непрерывно, то таких пар будет бесконечно много. Вы могли бы лучше просто починить один из них, а затем найти другой

Другие вопросы по тегам