Найти 2-конечную смешанную стратегию в Python

Я пытаюсь решить последовательность минимаксных задач между двумя игроками в симуляции футбола на сетке. Коэффициенты приведены, и я хочу получить смешанную стратегию.

Я попробовал Scipy.linprog, чтобы решить его как линейное программирование (как в https://docs.scipy.org/doc/scipy-0.19.1/reference/generated/scipy.optimize.linprog.html и https: // advancedoptimizationatharvard..wordpress.com / 2014/02/20 / применяя линейное программирование к теории игр /), и результат верен, но выводит только чистые стратегии. Например, у игрока есть 4 возможных действия. Первое действие получает выигрыш -100, а остальные три получают 0. Таким образом, в качестве смешанной стратегии вероятность выполнения каждого действия должна быть [0, 0,33, 0,33, 0,33], но результат от linprog всегда равен [0, 1, 0, 0].

Я знаю, что Гамбит, возможно, может решить эту проблему, но я не понимал, как использовать его с заданными коэффициентами и ограничениями.

0 ответов

Другие вопросы по тегам