Simpy может использоваться для определения сумм во времени (t+1) на основе времени (t) при моделировании процесса принятия решений Маркова.
Я новый пользователь с Simpy. Я хочу знать, когда это будет более полезным? Я в замешательстве, когда хочу определить суммы (во времени (t+1) на основе времени (t)) в процессе принятия решений по Маркову с использованием записи RL с помощью simpy (планирование событий) или я должен писать на основе (взаимодействие с процессом)) или какая-нибудь модель еще?
Например, у нас есть следующее:
St + 1 = St + at- min {Dt, st + at}
какой из них более пригоден для использования?