Скорость обучения слишком велика, как это влияет на функцию потерь для логистической регрессии с использованием пакетного градиентного спуска

Вопрос: Если скорость обучения (а) слишком велика, что происходит с графиком и как это может повлиять на функцию потерь с итерациями

Я где-то читал, что график может не сходиться или на графике может быть много колебаний, я просто хотел бы прояснить это. Я также не уверен, как это может повлиять на функцию потерь при построении графика.

1 ответ

ваша функция потерь со временем будет уменьшаться в зависимости от продолжительности и эпохи