MDP - методики генерации вероятности перехода

Я работаю над проблемой спроса и предложения автомобилей MDP следующим образом и думал о том, есть ли какие-либо методы для генерации матрицы вероятности перехода автоматически, а не вручную.

Предположим, что спрос выглядит следующим образом:
время, станция1, станция2
1000, 3, 1
1030, 3, 1
1100, 2, 3

Предположим, что для машины со станции 1 существует 60% -ная вероятность того, что машина будет доставлена ​​на станцию ​​1, и 40% - на станцию ​​2. Предположим, что для автомобиля со станции 2 существует 80% -ная вероятность того, что машина будет доставлена ​​на станцию ​​1, и 20% - на станцию ​​2.

Я рассчитал вручную, что следующее.

На этапе 1 времени

P(car at station1 = 2,car at station2 = 8) = 0.0432
P(car at station1 = 3,car at station2 = 7) = 0.2016
P(car at station1 = 4,car at station2 = 6) = 0.1344
P(car at station1 = 5,car at station2 = 5) = 0.0896
P(car at station1 = 6,car at station2 = 4) = 0.0512

Следовательно, хотелось бы проверить, может ли кто-нибудь предоставить информацию для автоматического вычисления вероятности на этапе 2 времени, а не для вычисления вручную.

За ваши советы, пожалуйста.

1 ответ

Я не уверен, что понимаю ваш вопрос.

Если в стационарном марковском процессе, распределение переменной состояния x_t (здесь, станция, на которой автомобиль) в данный момент t является функцией только матрицы перехода P и состояние в то время t-1,

Ты можешь написатьx_t = x_{t-1} * P для любого t, Который означает, что x_t = x_0 * P^t,

знание x_0 (распределение автомобилей в начале, например, если автомобили равномерно распределены между двумя станциями x_0 = [0.5 0.5]) и используя P = [ 0.6 0.4 ; 0.8 0.2 ]тогда вы получите раздачу авто в любое время t > 0 как x_t = x_0 * P^t,

Другие вопросы по тегам