Описание тега mdptoolbox

Набор инструментов Марковского процесса принятия решений (MDP) для Python - Набор инструментов MDP предоставляет классы и функции для разрешения процессов Маркова с дискретным временем принятия решений.
1 ответ

Должна ли матрица переходов из марковского процесса принятия решений быть стохастической?

Я пытаюсь найти оптимальную политику для задачи процесса принятия решений Маркова, указанной на этой диаграмме, используя Value Iteration (через pymdptoolbox) и NumPy. Но pymdptoolbox говорит, что моя матрица переходов "не стохастическая". Это из-за…
1 ответ

OverflowError, поскольку я пытаюсь использовать алгоритм итерации значения с mdptoolbox

Я установил простое MDP для платы, которая имеет 4 возможных состояния и 4 возможных действия. Настройка доски и вознаграждения выглядит следующим образом: Вот S4 является целевым состоянием и S2 это поглощающее состояние. Я определил матрицы вероят…
2 ответа

ModuleNotFoundError: нет модуля с именем 'mdptoolbox'

Я получаю сообщение об ошибке при импорте mdptoolbox модуль. import mdptoolbox, mdptoolbox.example Журналы ошибок: ModuleNotFoundError Traceback (последний вызов был последним) в () ----> 1 импорт mdptoolbox, mdptoolbox.example ModuleNotFoundError: …
28 янв '19 в 10:56
0 ответов

R MDPtoolbox: как увеличить количество итераций (используя R)

Я занимаюсь разработкой модели обучения с подкреплением в R и хочу увеличить число итераций решателя MDPtoolbox (solver $iter). Любая идея, пожалуйста? ниже мой код, который дает только 3 итерации, как заставить модель иметь больше итераций. 10^2, 1…
25 май '19 в 14:44
1 ответ

Понимание значений аргументов для примера леса mdptoolbox

Я пытаюсь понять, как использовать mdptoolbox и у меня было несколько вопросов. Что значит 20 значит в следующем утверждении? P, R = mdptoolbox.example.forest(10, 20, is_sparse=False) Я это понимаю 10 здесь обозначает количество возможных состояний.…
0 ответов

Ошибка сегментации для POMDP Solver

Я пытаюсь решить свою модель POMDP с помощью решателя POMDP, но он продолжает вызывать ошибку Seg Fault. Я написал свой файл POMDP в текстовом редакторе, а затем сохранил его с расширением .POMDP, не уверен, что это проблема или это мой код. введите…
31 янв '22 в 05:13
2 ответа

Python возвращает две одинаковые матрицы

Я пытаюсь написать небольшую программу для Марковского процесса принятия решений (задача инвентаризации) с использованием Python. Не могу понять, почему программа выводит две одинаковые матрицы (матрицы прибыли и матрицы решений). В самом программир…
01 фев '22 в 19:12
0 ответов

Оптимальная политика в зависимости от начального состояния MDPToolbox Python

Я пытаюсь использовать MDP Toolbox для реализации алгоритма для критерия вознаграждения «средний бесконечный» для случайного MDP, который я сгенерировал с помощью библиотеки Python MDPToolbox. Хотя эта библиотека обеспечивает оптимальную политику дл…