Косое нормальное распределение в scipy
Кто-нибудь знает, как построить скейп нормального распределения с помощью scipy? Я полагаю, что класс stats.norm можно использовать, но я просто не могу понять, как. Кроме того, как я могу оценить параметры, описывающие асимметричное нормальное распределение одномерного набора данных?
2 ответа
Решение
Из описания Википедии,
from scipy import linspace
from scipy import pi,sqrt,exp
from scipy.special import erf
from pylab import plot,show
def pdf(x):
return 1/sqrt(2*pi) * exp(-x**2/2)
def cdf(x):
return (1 + erf(x/sqrt(2))) / 2
def skew(x,e=0,w=1,a=0):
t = (x-e) / w
return 2 / w * pdf(t) * cdf(a*t)
# You can of course use the scipy.stats.norm versions
# return 2 * norm.pdf(t) * norm.cdf(a*t)
n = 2**10
e = 1.0 # location
w = 2.0 # scale
x = linspace(-10,10,n)
for a in range(-3,4):
p = skew(x,e,w,a)
plot(x,p)
show()
Если вы хотите найти параметры масштаба, местоположения и формы из набора данных, используйте scipy.optimize.leastsq
например, используя e=1.0
,w=2.0
а также a=1.0
,
fzz = skew(x,e,w,a) + norm.rvs(0,0.04,size=n) # fuzzy data
def optm(l,x):
return skew(x,l[0],l[1],l[2]) - fzz
print leastsq(optm,[0.5,0.5,0.5],(x,))
должен дать вам что-то вроде,
(array([ 1.05206154, 1.96929465, 0.94590444]), 1)
Принятый ответ более или менее устарел, потому что skewnorm
функция теперь реализована в scipy. Таким образом, код может быть написан намного короче:
from scipy.stats import skewnorm
import numpy as np
from matplotlib import pyplot as plt
X = np.linspace(min(your_data), max(your_data))
plt.plot(X, skewnorm.pdf(X, *skewnorm.fit(your_data))