Прометей, чтобы получить сигнал тревоги, когда узел находится в неконтролируемом состоянии
Может кто-нибудь помочь мне в написании запроса Promql, чтобы получить статус узла, является ли узел планируемым или нет. Заранее спасибо.
1 ответ
Если вы используете Прометей-оператор, kube-state-metrics
вернуть kube_node_status_condition
метрика:
sum(kube_node_status_condition{condition="Ready",status!="true"})
Приведенный выше ответ покажет, готов ли узел к этому или нет - узел может быть готов, но не имеет расписания (например, если вы оцепили узел с помощью:
kubectl cordon NODE)
Пример ниже должен охватывать готовый узел, который не подлежит планированию и также доступен через kube-state-metrics
sum(kube_node_spec_unschedulable) by (node)
Я имею в виду
machine_cpu_cores
метрика. Он покажет только готовые узлы в кластере Kubernetes.