Как рассчитать вероятный регион 95 для совместного распределения 2D?
Предположим, у нас есть совместное распределение p(x_1,x_2), и мы знаем x_1,x_2,p. Оба дискретны, (x_1,x_2) - разброс, его контур можно нарисовать, а также маргинальный. Я хотел бы показать область 95% квантиля (будет содержаться шкала 95% данных) совместного распределения, как я могу это сделать?
2 ответа
Как указывают другие, решения этой проблемы бесконечно много. Практическим является поиск приблизительного центра облака точек и расширение круга оттуда до тех пор, пока он не будет содержать приблизительно 95% данных. Затем найдите выпуклую оболочку выбранных точек и вычислите ее площадь.
Конечно, это будет работать, только если данные сконцентрированы в одной области. Это не будет работать, если есть несколько кластеров.
Если вы заинтересованы в нахождении пары x_1, x_2 действительных чисел, такой что P(X_1<=x_1, X_2<=x_2) = 0,95 и ваше распределение непрерывно, то таких пар будет бесконечно много. Вы могли бы лучше просто починить один из них, а затем найти другой