Описание тега mdptoolbox

Вопросы с тегом

Набор инструментов Марковского процесса принятия решений (MDP) для Python - Набор инструментов MDP предоставляет классы и функции для разрешения процессов Маркова с дискретным временем принятия решений.

1 ответ

Должна ли матрица переходов из марковского процесса принятия решений быть стохастической?

Я пытаюсь найти оптимальную политику для задачи процесса принятия решений Маркова, указанной на этой диаграмме, используя Value Iteration (через pymdptoolbox) и NumPy. Но pymdptoolbox говорит, что моя матрица переходов "не стохастическая". Это из-за…

27 апр '17 в 18:50

1 ответ

OverflowError, поскольку я пытаюсь использовать алгоритм итерации значения с mdptoolbox

Я установил простое MDP для платы, которая имеет 4 возможных состояния и 4 возможных действия. Настройка доски и вознаграждения выглядит следующим образом: Вот S4 является целевым состоянием и S2 это поглощающее состояние. Я определил матрицы вероят…

python dynamic-programming markov-chains stochastic mdptoolbox

21 ноя '18 в 11:56

2 ответа

ModuleNotFoundError: нет модуля с именем 'mdptoolbox'

Я получаю сообщение об ошибке при импорте mdptoolbox модуль. import mdptoolbox, mdptoolbox.example Журналы ошибок: ModuleNotFoundError Traceback (последний вызов был последним) в () ----> 1 импорт mdptoolbox, mdptoolbox.example ModuleNotFoundError: …

python mdptoolbox

28 янв '19 в 10:56

0 ответов

R MDPtoolbox: как увеличить количество итераций (используя R)

Я занимаюсь разработкой модели обучения с подкреплением в R и хочу увеличить число итераций решателя MDPtoolbox (solver $iter). Любая идея, пожалуйста? ниже мой код, который дает только 3 итерации, как заставить модель иметь больше итераций. 10^2, 1…

r reinforcement-learning mdptoolbox

25 май '19 в 14:44

1 ответ

Понимание значений аргументов для примера леса mdptoolbox

Я пытаюсь понять, как использовать mdptoolbox и у меня было несколько вопросов. Что значит 20 значит в следующем утверждении? P, R = mdptoolbox.example.forest(10, 20, is_sparse=False) Я это понимаю 10 здесь обозначает количество возможных состояний.…

python numpy reinforcement-learning mdptoolbox

08 июн '19 в 16:38

0 ответов

Ошибка сегментации для POMDP Solver

Я пытаюсь решить свою модель POMDP с помощью решателя POMDP, но он продолжает вызывать ошибку Seg Fault. Я написал свой файл POMDP в текстовом редакторе, а затем сохранил его с расширением .POMDP, не уверен, что это проблема или это мой код. введите…

reinforcement-learning solver mdp mdptoolbox

31 янв '22 в 05:13

2 ответа

Python возвращает две одинаковые матрицы

Я пытаюсь написать небольшую программу для Марковского процесса принятия решений (задача инвентаризации) с использованием Python. Не могу понять, почему программа выводит две одинаковые матрицы (матрицы прибыли и матрицы решений). В самом программир…

python numpy inventory mdp mdptoolbox

01 фев '22 в 19:12

0 ответов

Оптимальная политика в зависимости от начального состояния MDPToolbox Python

Я пытаюсь использовать MDP Toolbox для реализации алгоритма для критерия вознаграждения «средний бесконечный» для случайного MDP, который я сгенерировал с помощью библиотеки Python MDPToolbox. Хотя эта библиотека обеспечивает оптимальную политику дл…

python python-3.x markov-decision-process mdptoolbox

29 янв '21 в 20:54