Как динамически изменить пространство действий в тренажерном зале OpenAI и агентах keras-rl/Tensorforce?

Разработка новой среды OpenAI GYM и агента keras-rl.

Допустим, в начале есть 4 возможных действия (вверх / вниз / влево / вправо). Затем, на каком-то этапе симуляции (игры), есть только два возможных действия (влево / вправо).

Как лучше всего использовать keras-rl / gym api для его реализации? Ссылка / пример приветствуется.