Сценарий сбоя узла кластера Azure Kubernetes

Допустим, у меня есть 3 узла в моем кластере, и я хочу запустить 300 заданий.

Если я бегу 1 job per POD а также 100 pods per NODEчто произойдет, если узел выйдет из строя в Azure Kubernetes Service?

2 ответа

Решение

Эти задания перейдут в режим ожидания, так как Kubernetes поддерживает 110 модулей на узел, поэтому у них не будет ресурсов для поддержки отказоустойчивых заданий. Вы можете посмотреть на использование Cluster Autoscaler (Beta), и он предоставит больше хостов для выполнения тех заданий, которые находятся в состоянии ожидания.

если узел выходит из строя

Cluster Autoscaler (CA) можно использовать для обработки сбоев узлов в Azure с использованием групп автоматического масштабирования:

https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/cloudprovider/azure/README.md

https://docs.microsoft.com/en-us/azure/aks/autoscaler

https://docs.microsoft.com/en-us/azure/aks/scale-cluster

Другие вопросы по тегам