Кластеры GKE не контролируются StackDriver
Мои кластеры GKE не контролируются Stackdriver, несмотря на то, что облачный мониторинг включен. В частности, https://app.google.stackdriver.com/gke просто сообщает: "У вас нет ресурсов такого типа, отслеживаемых Stackdriver".
- Кластеры под управлением Kubernetes 1.2.4, созданные в середине мая 2016 года.
- В некоторых облачный мониторинг был включен при создании, в некоторых - через
gcloud container clusters update serve --monitoring-service=monitoring.googleapis.com
, - Все кластеры работают
heapster
модуль с готовностью 2/2, состояние "Бег", перезагрузок нет, например какheapster-v1.0.2-594732231-76sdj
, - Все кластеры работают
heapster
сервис с кластерным IP, без внешнего IP и порта 80/TCP. - Журналы
heapster
стручок,heapster
Контейнер выглядит так:
I0609 09: 15: 05.000189 1 manager.go: 79] Начало очистки показателей: 2016-06-09 09:14:00 +0000 UTC, конец: 2016-06-09 09:15:00 +0000 UTC
I0609 09: 15: 05.023729 1 manager.go: 152] ScrapeMetrics: время: 23.435264мс размер: 25
- Журналы
heapster
стручок,heapster-nanny
Контейнер выглядит так:
I0609 09: 18: 03.968201 1 nanny_lib.go: 90] Количество узлов 1
I0609 09: 18: 03.971459 1 nanny_lib.go: 98] Ресурсы контейнера: &{map[memory:{213909504.000000000 BinarySI} cpu:{0.100000000 DecimalSI}]] map [cpu: {0.100000000 DecimalSI} память: {213909504.000000000} BSI
I0609 09: 18: 03.971522 1 nanny_lib.go:102] Ожидаемые ресурсы: &{map[cpu:{0.100000000 DecimalSI} память:{218103808.000000000 BinarySI}] map[cpu:{0.100000000 DecimalSI} память: {218103808.000000000} BSI
I0609 09:18:03.971634 1 nanny_lib.go:106] Ресурсы находятся в ожидаемых пределах.
- https://status.cloud.google.com/ показывает все сервисы зеленым цветом.
1 ответ
Оказывается, что в Stackdriver возникла проблема с неправильным отображением кластеров нового поколения в его пользовательском интерфейсе. Метрики собирались должным образом и были доступны через их API все время. Теперь проблема должна быть решена, но команда очень сожалеет о любых проблемах, которые это вызвало, и будет работать над тем, чтобы быстрее выявлять подобные проблемы.