Параметры для подогнанного распределения

При поиске наиболее подходящего распределения для моего набора данных получилось экспоненциально измененное нормальное распределение со следующими параметрами:

K=10.84, loc=154.35, scale=73.82 

Сципи дает нам возможность проанализировать среднее значение распределения:

  fitted_mean =  scipy.stats.exponnorm.stats(K=10.84, loc=154.35, scale=73.82, moments='mean') 

Результирующий fit_mean=984, что соответствует среднему значению моего набора данных. Тем не менее, я не уверен, что это говорит мне. Я думал, что loc=154,35 является средним значением распределения.

Каковы эти два средства? Если я подгоняю данные с лучшим распределением, не будет ли fit_mean (154.35) новым и единственным значением?

1 ответ

Решение

Для экспоненциально модифицированного нормального распределения параметр местоположения не совпадает со средним. Это верно для многих дистрибутивов.

Посмотрите на страницу википедии экспоненциально модифицированного распределения Гаусса. Это то же распределение, что и scipy.stats.exponnorm, но с другой параметризацией. Сопоставление параметров между версией википедии и scipy:

μ = loc
σ = scale
λ = 1/(K*scale)

На странице википедии сказано, что среднее значение распределения равно μ + 1/λ, что в терминах параметров scipy loc + K*scale,

Когда вы подгоняете дистрибутив к вашим данным, вы нашли

loc = 154.35
scale = 73.82 
K = 10.84

Формула для среднего значения на странице википедии дает

loc + K*scale = 954.5587999999999

Вот расчет с использованием exponnorm:

In [16]: fitted_mean = scipy.stats.exponnorm.stats(K=10.84, loc=154.35, scale=73.82, moments='mean')

In [17]: fitted_mean
Out[17]: array(954.5587999999999)

который соответствует результату из формулы Википедии.

(Вы сообщили fitted_mean = 984, но я предполагаю, что это была опечатка.)

Другие вопросы по тегам