Запрет Kops от замены установки докера при подготовке узлов

Я использую пользовательские образы (AMI), настроенные для машинного обучения на экземплярах EC2 с поддержкой графического процессора.

Это означает cuda, libcudnn6, nvidia-docker и т. д. все правильно настроены на них.

Однако, когда Kops запускает новые узлы из этих AMI (я использую cluster-autoscaler), он переопределяет мой правильно настроенный докер.

Как я могу предотвратить это?

Сейчас я запускаю собственный скрипт при запуске, который переустанавливает nvidia-docker правильно, но это явно не идеально.

1 ответ

Решение

Kops установит docker, только если будет разница между версией, которую он ожидает использовать, и версией, которая уже установлена ​​на узле.

Обратите внимание, что Kops понизит версию докера, если установленная версия будет выше ожидаемой!

Таким образом, решение моей проблемы состояло в том, чтобы иметь предварительно установленную версию, которая соответствует spec.docker.version,

Для этого нам пришлось понизить докер до 17.03.2 и NVIDIA-докер для 2.0.3+docker17.03.2-1,

Другие вопросы по тегам