Как продолжить обучение DQN или DDPG после прерывания предыдущего обучения? D

Когда я занимаюсь обучением с подкреплением, я должен каждый раз начинать обучение с самого начала. На это уходит много времени. Есть ли решение начать тренировку по результатам предыдущих тренировок? Спасибо.

1 ответ

Если вы выполняете обучение с подкреплением на основе эпизодов, вы можете сохранять сети, которые вы обучили, в файл каждые X эпизодов. Когда вы запускаете сценарий, вы можете проверить, существует ли этот файл, и загрузить его вместо того, чтобы начинать с пустой сети.

Как это сделать, зависит от того, какой язык программирования вы используете.

Если вы используете Python, вы можете сохранить свои данные, таблицу состояний и веса нейронной сети с помощью модулей Pickle или JSON.