Ошибка подгонки гамма-распределения

Для задачи классификации я хочу подогнать гамма-распределение к двум парам данных: расстояние между классами и классами. Это делается для определения теоретической вероятности ложного принятия и ложного отказа.

Пригодность Сципи возвращает меня в тупик. Ниже приведен график данных, где кружки обозначают в пределах расстояний между классами и x-es между расстоянием между классами, сплошная линия - это подобранная гамма в пределах класса, пунктирная линия - это подобранная гамма на расстоянии между классами.

То, что я ожидал бы, - то, что гамма-кривые достигли бы пика в пределах ~10 и ~30, не в 0 для обоих. Кто-нибудь видит, что здесь происходит не так?

Это мой код:

pos = [7.4237931034482765, 70.522068965517235, 9.1634482758620681, 22.594137931034485, 7.3003448275862075, 6.3841379310344841, 10.693448275862071, 7.5237931034482761, 7.4079310344827594, 7.2696551724137928, 8.5551724137931036, 17.647241379310344, 7.8475862068965521, 14.397586206896554, 32.278965517241382]
neg = [32.951724137931038, 234.65724137931034, 25.530000000000001, 33.236551724137932, 258.49965517241378, 33.881724137931037, 18.853448275862071, 33.703103448275861, 33.655172413793103, 33.536551724137929, 37.950344827586207, 34.32586206896552, 42.997241379310346, 100.71379310344828, 32.875172413793102, 30.59344827586207, 19.857241379310345, 35.232758620689658, 30.822758620689655, 34.92896551724138, 29.619310344827586, 29.236551724137932, 32.668620689655171, 30.943448275862071, 30.80344827586207, 88.638965517241374, 25.518620689655172, 38.350689655172417, 27.378275862068971, 37.138620689655177, 215.63379310344828, 344.93896551724134, 225.93413793103446, 103.66758620689654, 81.92896551724138, 59.159999999999997, 463.89379310344827, 63.86827586206897, 50.453103448275861, 236.4603448275862, 273.53137931034485, 236.26103448275862, 216.26758620689654, 170.3003448275862, 340.60034482758618]

alpha1, loc1, beta1=ss.gamma.fit(pos, floc=0)
alpha2, loc2, beta2=ss.gamma.fit(neg, floc=0)

plt.plot(pos,[0.06]*len(pos),'ko')
plt.plot(neg,[0.04]*len(neg),'kx')

x = range(200)
plt.plot(x,ss.gamma.pdf(x, alpha1, scale=beta1), '-k')
plt.plot(x,ss.gamma.pdf(x, alpha2, scale=beta2), ':k')
plt.xlim((0,200))

Прикол с floc=0, который я получил отсюда: почему гамма-распределение в SciPy имеет три параметра? Но это не всегда заставляет loc1 и loc2 быть 0:/

1 ответ

Решение

(Это действительно комментарий, но я хочу показать сюжет, который я получаю.)

Вы уверены, что использовали floc=0 в fit метод, когда вы сделали сюжет? Если я пропущу это (или если я сделаю ошибку - как я часто делаю - использования loc=0 вместо floc=0), Я получаю сюжет, похожий на тот, который вы включили.

Какие версии scipy и numpy вы используете?

С scipy 0.12.0 и numpy 1.7.1 ваш код работает для меня. Я добавил пару print заявления, и я получаю:

alpha1 = 1.86456504055  beta1 = 8.47415903767
alpha2 = 1.17943740138  beta2 = 86.51957394

вместе с сюжетом:

введите описание изображения здесь

Другие вопросы по тегам