Запуск заданий с большими изображениями докеров в мезо через аврору может быть медленным

При запуске задачи через мезо через Аврору, которая использует довольно большой образ докера (~2 ГБ), существует долгое время ожидания, прежде чем задача действительно запустится.

Даже если задача была ранее запущена, и мы ожидаем, что образ докера уже будет доступен для рабочего узла, все еще существует время ожидания, зависящее от размера изображения, прежде чем задача действительно запустится. Используя Docker, вы можете запускать контейнер практически мгновенно, если он уже есть в вашем списке изображений. Разве контейнер-мезосодержатель также не поддерживает это "кэширование"? Эта функция может быть настроена?

Я не пробовал использовать докер-контейнерный контейнер, но, насколько я понимаю, он все равно скоро будет ликвидирован, а изоляция ресурсов gpu, которая нам требуется, работает только для контейнерного мезосодержателя.

1 ответ

Решение

Я предполагаю, что вы говорите об объединенном контейнере, работающем с образами докеров? Какой бэкэнд вы используете? По умолчанию агенты Mesos используют механизм копирования, поэтому вы видите, что он медленный. Вы можете посмотреть на бэкэнд, который использует агент, нажав flags конечная точка на агенте. Переключите бэкэнд на aufs или overlayfs, чтобы увидеть, ускоряет ли запуск. Вы можете указать бэкэнд через флаг --image_provisioner_backend=VALUE на агента.

ПРИМЕЧАНИЕ: есть несколько исправлений ошибок, связанных с aufs а также overlayfs бэкэнд в последней версии Mesos 1.2.0-rc1, который вы можете выбрать. Не говоря уже о том, что в 1.2.0-rc1 есть функция автобэкэнда, которая автоматически выбирает самый быстрый из доступных бэкэндов.

Другие вопросы по тегам