Почему я не получаю те же результаты от BFGS сворачивания в Python, как те, что в MATLAB?
Я пытаюсь найти минимум функции Минимум функции с помощью метода BFGS (Страница 29 документа PDF)
И я не получаю такие же результаты, как те, о которых сообщается в ссылке, я уже пробовал с якобианом и без него без удачи. Любая помощь, будет оценена.
Код до сих пор:
import numpy as np
from scipy.optimize import minimize
def objective(x):
x1=x[0]
x2=x[1]
print ("x1: ",x1," ","x2: ",x2)
return pow(x1,4.0)-2*x2*pow(x1,2.0)+pow(x2,2.0)+pow(x1,2.0)-2.0*x1+5.0
def jacobiano(x):
x1=x[0]
x2=x[1]
jaco=np.zeros(2)
jaco[0]=4.0*x1-4.0*x2*x1+2.0*x1-2.0
jaco[1]=-2.0*pow(x1,2.0)+2.0*x2
print ("dx1: ",jaco[0]," ","dx2: ",jaco[1])
return jaco
x0=np.array([1.0,2.0], dtype=np.double)
print(objective(x0))
sol=minimize(objective,x0,method='BFGS',jac=jacobiano, options={'disp': True})
print(sol)
1 ответ
Решение
Проблема возникает потому, что вы неправильно рассчитали якобиан, в вашем случае df/dx1
это неверно.
если f = x1**4 -2*x2*x1**2 +x2**2+ x1**2 -2.0*x1+5.0
затем df/dx1 = 4.0*x1**3 -4.0*x2*x1 + 2.0*x1-2.0
import numpy as np
from scipy.optimize import minimize
def objective(x):
x1, x2 = x
print ("x1: ",x1," ","x2: ",x2)
return x1**4 -2*x2*x1**2 +x2**2+ x1**2 -2.0*x1+5.0
def jacobiano(x):
x1, x2 = x
jaco=np.zeros(2)
jaco[0]=4.0*x1**3 -4.0*x2*x1 + 2.0*x1-2.0
jaco[1]=-2.0*x1**2.+2.0*x2
print("dx1: ",jaco[0]," ","dx2: ",jaco[1])
return jaco
x0=np.array([1.0,2.0], dtype=np.double)
sol=minimize(objective,
x0,method='BFGS',jac=jacobiano, options={'disp': True})
print(sol)
Выход:
Optimization terminated successfully.
Current function value: 4.000000
Iterations: 7
Function evaluations: 9
Gradient evaluations: 9
fun: 4.000000000002963
hess_inv: array([[ 0.50324351, 1.0154575 ],
[ 1.0154575 , 2.55695728]])
jac: array([ 7.65547714e-06, -2.90129716e-06])
message: 'Optimization terminated successfully.'
nfev: 9
nit: 7
njev: 9
status: 0
success: True
x: array([ 1.00000093, 1.0000004 ])
Matlab:
x1=1.00863, x2=1.01932, f=4.00008
Python:
x1=1.00000093, x2=1.0000004, f=4.000000000002963
Оптимальным решением
x1=1.0, x2=1.0, f=4.0