Когда САРСА лучше, чем ожидаемая САРСА?
Я прохожу курс обучения по усилению Cousera и застрял в этом вопросе с несколькими вариантами ответов. Я перепробовал более 40 разных ответов и не смог сделать это правильно. Очень ценю любые намеки на это. Спасибо!
Когда САРСА лучше, чем ожидаемая САРСА?
1. В тех случаях, когда пространство состояний слишком велико, поэтому мы не можем интегрировать приближения по огромному пространству состояний.
2, в случаях, когда невозможно вычислить явное ожидание по стохастичности политики.
3, в случаях, когда у нас много параметров W.
4, в тех случаях, когда у нас есть только несколько параметров W.
5, в случаях, когда гамма слишком велика.
6. В тех случаях, когда пространство действия слишком велико, поэтому мы не можем интегрировать приближения по огромному пространству действия.