Не удалось сохранить результаты: истекло время ожидания условия в рабочем процессе Argo
Я управляю рабочим процессом Argo на Kubernetes. И после того, как я следил за этим блогом, чтобы настроить Jupyterhub, я начал получать эту ошибку (никогда не было проблемы до использования Jupyterhub) на модулях на Argo:failed to save outputs: timed out waiting for the condition
,
Работа всегда терпит неудачу, если я добавляю
resources:
limits:
nvidia.com/gpu: 1
Но если gpu не используется, иногда это происходит успешно (с retryStrategy после случайных сбоев).
Может ли кто-нибудь помочь мне?
2 ответа
проверьте, упомянули ли вы имя serviceAccountName
workflow.spec.serviceAccountName
для получения дополнительной информации проверьте эту ссылку
У меня аналогичная ошибка, потому что мои artifactLogs не могут быть сохранены в minio из-за SSL, подписанного внутренним центром сертификации, и контейнер ожидания не монтирует мой том /volumeMounts, содержащий CA.crt