python curve_fit не дает разумного результата подгонки
Я пытаюсь подогнать гауссов к спектру, а значения у имеют порядок 10^(-19). Curve_fit дает мне плохой результат подгонки как до, так и после того, как я умножу все свои данные на 10 ^ (- 19). Прикреплен мой код, это довольно простой набор данных, за исключением того, что значения очень малы. Если я хочу сохранить свои исходные значения, как я получу разумное гауссовское соответствие, которое даст мне правильные параметры?
#get fits data
aaa=pyfits.getdata('p1.cal.fits')
aaa=np.matrix(aaa)
nrow=np.shape(aaa)[0]
ncol=np.shape(aaa)[1]
ylo=79
yhi=90
xlo=0
xhi=1023
glo=430
ghi=470
#sum all the rows to get spectrum
ysum=[]
for x in range(xlo,xhi):
sum=np.sum(aaa[ylo:yhi,x])
ysum.append(sum)
wavelen_pix=range(xhi-xlo)
max=np.max(ysum)
print "maximum is at x=", np.where(ysum==max)
##fit gaussian
#fit only part of my data in the chosen range [glo:ghi]
x=wavelen_pix[glo:ghi]
y=ysum[glo:ghi]
def func(x, a, x0, sigma):
return a*np.exp(-(x-x0)**2/float((2*sigma**2)))
sig=np.std(ysum[500:1000]) #std of background noise
popt, pcov = curve_fit(func, x, sig)
print popt
#this gives me [1.,1.,1.], which is obviously wrong
gaus=func(x,popt[0],popt[1],popt[2])
aaa - матрица изображения 153 на 1024, частично выглядит так:
matrix([[ -8.99793629e-20, 8.57133275e-21, 4.83523386e-20, ...,
-1.54811004e-20, 5.22941515e-20, 1.71179195e-20],
[ 2.75769318e-20, 1.03177243e-20, -3.19634928e-21, ...,
1.66583803e-20, -9.88712568e-22, -2.56897725e-20],
[ 2.88121935e-20, 8.57964252e-21, -2.60784327e-20, ...,
1.72335180e-20, -7.61189937e-21, -3.45333075e-20],
...,
[ 1.04006903e-20, 1.61200683e-20, 7.04195205e-20, ...,
1.72459645e-20, 4.29404029e-20, 1.99889374e-20],
[ 3.22315752e-21, -5.61394194e-21, 3.28763096e-20, ...,
1.99063583e-20, 2.12989880e-20, -1.23250648e-21],
[ 3.66591810e-20, -8.08647455e-22, -6.22773168e-20, ...,
-4.06145681e-21, 4.92453132e-21, 4.23689309e-20]], dtype=float32)
1 ответ
Ты звонишь curve_fit
неправильно, вот использование
curve_fit(f, xdata, ydata, p0=None, sigma=None, absolute_sigma=False, check_finite=True, **kw)
- f - ваша функция, первый аргумент которой представляет собой массив независимых переменных, а последующие аргументы - параметры функции (такие как амплитуда, центр и т. д.)
- xdata - независимые переменные
- ydata является зависимой переменной
- p0 - начальное предположение о параметрах функции (для Guassian это амплитуда, ширина, центр)
По умолчанию для p0 задан список единиц [1,1,...], и, вероятно, именно поэтому вы получаете это, в результате чего подбор никогда не выполнялся, потому что вы вызвали его неправильно.
Попробуйте оценить амплитуду, центр и ширину по данным, затем создайте объект p0 (подробности см. Ниже)
init_guess = ( a_i, x0_i, sig_i) # same order as they are supplied to your function
popt, pcov = curve_fit(func, xdata=x,ydata=y,p0=init_guess)
Вот короткий пример
xdata = np.linspace(0, 4, 50)
mygauss = ( 10,2,0.5) #( amp, center, width)
y = func(xdata, *mygauss ) # using your func defined above
ydata = y + 2*(np.random.random(50)- 0.5) # add some noise to create fake data
Теперь я могу угадать подходящие параметры
ai = np.max( ydata) # guess the amplitude
xi = xdata[ np.argmax( ydata)] # guess the position of center
Предполагая, что ширина хитрая, я сначала нашел бы, где находится половинный максимум (их два, но вам нужно только найти один, так как гауссов симметричен):
pos_half = argmin( np.abs( ydata-ao/2 ) ) # subtract half the amplitude and find the minimum
Теперь оцените, как далеко это находится от центра гауссиана (xi):
sig_i = np.abs( xi - xdata[ pos_half] ) # estimate the width
Теперь вы можете сделать первоначальное предположение
init_guess = (ai, xi sig_i)
и подходит
params, variance = curve_fit( func, xdata=xdata, ydata=ydata, p0=init_guess)
print params
#array([ 9.99457443, 2.01992858, 0.49599629])
что очень близко к mygauss
, Надеюсь, поможет.
Забудьте о масштабировании, линейных изменениях или использовании параметра p0, которые обычно не работают! Попробуйте использовать параметр bounds в curve_fit для n таких параметров:
a0=np.array([a01,...,a0n])
af=np.array([af1,...,afn])
method="trf",bounds=(a0,af)
Надеюсь, что это работает!;)