пространство дискретных действий в рамках базовой линии

Я работаю с алгоритмом DQN в стабильной базе. Мне нужно определить действие с двумя параметрами (например, a(i,j)). Можно ли определить его с помощью дискретного пространства действий, если да, то как я могу его определить?

Большое спасибо за Вашу помощь.

0 ответов

Другие вопросы по тегам