Когда САРСА лучше, чем ожидаемая САРСА?

Я прохожу курс обучения по усилению Cousera и застрял в этом вопросе с несколькими вариантами ответов. Я перепробовал более 40 разных ответов и не смог сделать это правильно. Очень ценю любые намеки на это. Спасибо!

Когда САРСА лучше, чем ожидаемая САРСА?

1. В тех случаях, когда пространство состояний слишком велико, поэтому мы не можем интегрировать приближения по огромному пространству состояний.

2, в случаях, когда невозможно вычислить явное ожидание по стохастичности политики.

3, в случаях, когда у нас много параметров W.

4, в тех случаях, когда у нас есть только несколько параметров W.

5, в случаях, когда гамма слишком велика.

6. В тех случаях, когда пространство действия слишком велико, поэтому мы не можем интегрировать приближения по огромному пространству действия.

0 ответов

Другие вопросы по тегам