Параметры для подогнанного распределения
При поиске наиболее подходящего распределения для моего набора данных получилось экспоненциально измененное нормальное распределение со следующими параметрами:
K=10.84, loc=154.35, scale=73.82
Сципи дает нам возможность проанализировать среднее значение распределения:
fitted_mean = scipy.stats.exponnorm.stats(K=10.84, loc=154.35, scale=73.82, moments='mean')
Результирующий fit_mean=984, что соответствует среднему значению моего набора данных. Тем не менее, я не уверен, что это говорит мне. Я думал, что loc=154,35 является средним значением распределения.
Каковы эти два средства? Если я подгоняю данные с лучшим распределением, не будет ли fit_mean (154.35) новым и единственным значением?
1 ответ
Для экспоненциально модифицированного нормального распределения параметр местоположения не совпадает со средним. Это верно для многих дистрибутивов.
Посмотрите на страницу википедии экспоненциально модифицированного распределения Гаусса. Это то же распределение, что и scipy.stats.exponnorm
, но с другой параметризацией. Сопоставление параметров между версией википедии и scipy:
μ = loc
σ = scale
λ = 1/(K*scale)
На странице википедии сказано, что среднее значение распределения равно μ + 1/λ, что в терминах параметров scipy loc + K*scale
,
Когда вы подгоняете дистрибутив к вашим данным, вы нашли
loc = 154.35
scale = 73.82
K = 10.84
Формула для среднего значения на странице википедии дает
loc + K*scale = 954.5587999999999
Вот расчет с использованием exponnorm
:
In [16]: fitted_mean = scipy.stats.exponnorm.stats(K=10.84, loc=154.35, scale=73.82, moments='mean')
In [17]: fitted_mean
Out[17]: array(954.5587999999999)
который соответствует результату из формулы Википедии.
(Вы сообщили fitted_mean = 984
, но я предполагаю, что это была опечатка.)