Распределение по Парето и соответствие графика

У меня есть фигура, показанная ниже, я хочу знать, соответствует ли она распределению Парето или нет? Это совокупный сюжет. И я хочу выяснить точку на оси х, которая отмечает точку для правила 80-20, то есть точку на оси х, которая раздваивает график на 20 процентов, имея 80 процентов богатства.

Кроме того, меня очень смущает функция Парето scipy.stats, было бы здорово, если бы кто-то дал интуитивное объяснение этому, поскольку документация довольно запутанная.

2 ответа

scipy.stats.pareto обеспечивает случайное получение из распределения Парето.

Чтобы узнать, соответствует ли ваш дистрибутив распределению Парето, вы должны выполнить тест Колмогорова-Смирнова. Нарисуйте случайную выборку из распределения Парето, используя pareto.rvs(shape, size=1000), где shape является оценочным параметром формы вашего распределения Парето, и используйте scipy.stats.kstest выполнить тест:

pareto_smp = pareto.rvs(shape, size=1000)
D, p_value = scipy.stats.kstest(pareto_smp, values)

Никто не может просто определить, соответствует ли набор данных наблюдений определенному распределению. исходя из вашей ситуации, что вам нужно:

подберите эмпирическое распределение, используя: statsmodels.ECDF

затем сравните (непараметрическое) это с вашими данными, чтобы увидеть, можно ли отвергнуть нулевую гипотезу

для правила 20/80: измените масштаб своего X на диапазон [0,1] и просто возьмите 0,2 на оси x

источник: https://arxiv.org/pdf/1306.0100.pdf

Другие вопросы по тегам