Выполнение пакетного задания Openshift застряло надолго
Я развернул пакетное задание на платформе контейнера openshift и запустил его с помощью файла конфигурации с помощью CLI openshift. Эта работа должна запускаться каждые 30 минут. Он появляется каждые 30 минут, создает контейнер, и один модуль выполняет некоторые логические операции и самоуничтожается. Он работал нормально долго, но недавно мы заметили, что пакетное задание зависло более чем на 4 дня.
Мы ищем обходной путь для решения этой ситуации. Идея состоит в том, чтобы принудительно уничтожить контейнер и контейнер, если он не самоуничтожится в течение 60 минут.
Я нашел некоторые события контейнера openshift, как ExceededGracePeriod
в URL ниже, но не уверен, как его использовать.
https://docs.openshift.com/container-platform/3.5/dev_guide/events.html