Сценарий сбоя узла кластера Azure Kubernetes
Допустим, у меня есть 3 узла в моем кластере, и я хочу запустить 300 заданий.
Если я бегу 1 job per POD
а также 100 pods per NODE
что произойдет, если узел выйдет из строя в Azure Kubernetes Service?
2 ответа
Решение
Эти задания перейдут в режим ожидания, так как Kubernetes поддерживает 110 модулей на узел, поэтому у них не будет ресурсов для поддержки отказоустойчивых заданий. Вы можете посмотреть на использование Cluster Autoscaler (Beta), и он предоставит больше хостов для выполнения тех заданий, которые находятся в состоянии ожидания.
если узел выходит из строя
Cluster Autoscaler (CA) можно использовать для обработки сбоев узлов в Azure с использованием групп автоматического масштабирования: