Запрет Kops от замены установки докера при подготовке узлов
Я использую пользовательские образы (AMI), настроенные для машинного обучения на экземплярах EC2 с поддержкой графического процессора.
Это означает cuda
, libcudnn6
, nvidia-docker
и т. д. все правильно настроены на них.
Однако, когда Kops запускает новые узлы из этих AMI (я использую cluster-autoscaler), он переопределяет мой правильно настроенный докер.
Как я могу предотвратить это?
Сейчас я запускаю собственный скрипт при запуске, который переустанавливает nvidia-docker
правильно, но это явно не идеально.
1 ответ
Kops установит docker, только если будет разница между версией, которую он ожидает использовать, и версией, которая уже установлена на узле.
Обратите внимание, что Kops понизит версию докера, если установленная версия будет выше ожидаемой!
Таким образом, решение моей проблемы состояло в том, чтобы иметь предварительно установленную версию, которая соответствует spec.docker.version
,
Для этого нам пришлось понизить докер до 17.03.2
и NVIDIA-докер для 2.0.3+docker17.03.2-1
,