Как измерить распределение атрибута данного населения?
У меня есть каталог из 900 приложений. Мне нужно определить, как их надежность распределяется в целом. (т.е. это нормально).
Я могу измерить надежность отдельного приложения.
Как я могу определить надежность группы в целом, не измеряя каждую?
1 ответ
Это довольно открытый вопрос! В целом, распределение распределения может быть довольно сложным и лучше всего работает с большими выборками (100 или даже 1000). Как правило, лучше выбирать распределение моделирования, основанное на известных характеристиках процесса, который вы пытаетесь смоделировать, чем использовать чисто эмпирическую подгонку.
Если вы собираетесь использовать эмпирические данные, для начала вы можете взять случайную выборку, измерить показатели надежности (независимо от того, что вы используете для этого) своей выборки, отсортировать их и построить график по сравнению с обычными квантилями. Если они располагаются вдоль относительно прямой линии, нормальное распределение является правдоподобной моделью, и вы можете оценить среднее значение выборки и дисперсию для ее параметризации. Вы можете применить ту же идею построения графиков против квантилей из других предложенных распределений, чтобы увидеть, насколько они правдоподобны.
В особенности следите за поведением в хвостах. По определению, хвосты встречаются редко и могут быть недостаточно представлены в вашем образце. Как и все статистические данные, чем больше будет размер выборки, тем лучше будут ваши результаты.
Я также добавил бы, что мое предыдущее убеждение состояло бы в том, что нормальное распределение не подойдет. Ваши оценки надежности, вероятно, падают в ограниченном диапазоне, имеют тенденцию падать больше к одной или другой стороне этого диапазона. Если они стремятся к верхнему диапазону, я бы предсказал, что они будут отрезаны в конце диапазона и имеют длинный хвост к нижней стороне, и наоборот, если они стремятся к низкому диапазону.