Расчет полезности в процессе декомпозиции Маркова
Я читаю о функциях полезности в книге "Искусственный интеллект" Стюарта Рассела и Питера Норвиг. В главе 17 проблема деквеста последовательных хвостов.
Я не возражаю против того, как автор вычислил значения, показанные на рис. 17.3, с гамма-гамма-значением, равным 1, и значением текущего состояния R (s), равным -0,04, за исключением целевых состояний, которые в данном примере равны 1 и -1.
Например, U(3,3), как рассчитывается значение 0,918?