Градиентный спуск расходится, слишком высокая скорость обучения

Question

Градиентный спуск расходится, слишком высокая скорость обучения

Ниже приведен фрагмент кода, который выполняет GD шаг за шагом, но тэта расходится. Что может быть не так?

X = arange(100)
Y = 50 + 4*X + uniform(-20, 20, X.shape)

theta = array([0,0])
alpha = 0.001
# one step of GD
theta0 = theta[0] - alpha * sum( theta[0]+theta[1]*x-y    for x,y in zip(X,Y))/len(X)
theta1 = theta[1] - alpha * sum((theta[0]+theta[1]*x-y)*x for x,y in zip(X,Y))/len(X)
theta = [theta0, theta1]

0

python-3.x gradient-descent

Источник

user2375119 14 дек '16 в 13:32

1 ответ

Решение

Другие вопросы по тегам python-3.x gradient-descent

user2375119 14 дек '16 в 20:09 2016-12-14 20:09 · Accepted Answer · 2016-12-14 20:09

Скорость обучения была слишком высокой.

alpha = 0.0001

1

Источник

user2375119 14 дек '16 в 20:09