Как интегрировать пространство Dict тренажерного зала OpenAI в структуру обучения с подкреплением?

Я создаю тренажерный зал, и у меня есть несколько входных массивов в качестве входных (разных размеров). Самый простой способ интегрировать мою среду в тренажерный зал - использовать пространство Dict в качестве пространства моей среды (каждая из записей обозначает одно из пространств), но проблема в том, что библиотека стабильной базовой линии, которую я собираюсь использовать для мое обучение не принимает тип пространства Dict? какие решения у меня есть для решения этой проблемы? Есть ли другая библиотека, которая принимает пробелы Dicts в качестве входных данных?

0 ответов

Другие вопросы по тегам