Calico-etcd не планируется на GKE 1.11 K8S

Я недавно обновил свой кластер GKE с 1.10.x до 1.11.x и с тех пор мой calico-node стручки не могут подключиться к кластеру etcd и в конечном итоге CrashLoopBackOff из-за ошибки livenessProbe.

Я видел, что calico-etcd DaemonSet имеет желаемое состояние 0 и интересовался этим. nodeSelector находится в node-role.kubernetes.io/master=,

Из журналов таких calico-nodes:

2018-12-19 19:18:28.989 [INFO][7] etcd.go 373: Unhandled error: client: etcd cluster is unavailable or misconfigured; error #0: client: endpoint http://10.96.232.136:6666 exceeded header timeout

2018-12-19 19:18:28.989 [INFO][7] startup.go 254: Unable to query node configuration Name="gke-brokerme-ubuntu-pool-852d0318-j5ft" error=client: etcd cluster is unavailable or misconfigured; error #0: client: endpoint http://10.96.232.136:6666 exceeded header timeout

Состояние DaemonSets:

NAME                       DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR                                  AGE
calico-etcd                0         0         0       0            0           node-role.kubernetes.io/master=                3d
calico-node                2         2         0       2            0           <none>                                         3d

k get nodes --show-labels:

NAME                                     STATUS   ROLES    AGE   VERSION         LABELS
gke-brokerme-ubuntu-pool-852d0318-7v4m   Ready    <none>   4d    v1.11.5-gke.5   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/fluentd-ds-ready=true,beta.kubernetes.io/instance-type=n1-standard-2,beta.kubernetes.io/os=linux,cloud.google.com/gke-nodepool=ubuntu-pool,cloud.google.com/gke-os-distribution=ubuntu,failure-domain.beta.kubernetes.io/region=europe-west1,failure-domain.beta.kubernetes.io/zone=europe-west1-b,kubernetes.io/hostname=gke-brokerme-ubuntu-pool-852d0318-7v4m,os=ubuntu
gke-brokerme-ubuntu-pool-852d0318-j5ft   Ready    <none>   1h    v1.11.5-gke.5   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/fluentd-ds-ready=true,beta.kubernetes.io/instance-type=n1-standard-2,beta.kubernetes.io/os=linux,cloud.google.com/gke-nodepool=ubuntu-pool,cloud.google.com/gke-os-distribution=ubuntu,failure-domain.beta.kubernetes.io/region=europe-west1,failure-domain.beta.kubernetes.io/zone=europe-west1-b,kubernetes.io/hostname=gke-brokerme-ubuntu-pool-852d0318-j5ft,os=ubuntu

Я не модифицировал манифесты ситца, они должны быть предоставлены GKE 1: 1.

Я ожидал бы либо calico-nodeподключиться к etc моего кластера Kubernetes или к calico-etcd предоставленный DaemonSet. Поскольку в GKE нет главного узла, которым я могу управлять, я понимаю, почему calico-etcd находится в состоянии 0, но затем, к которому и т. д. calico-nodeдолжен соединиться? Что не так с моей маленькой и базовой настройкой?

1 ответ

Нам известна проблема циклического сбоя ситца в GKE 1.11.x. Вы можете решить эту проблему путем обновления до более новых версий. Я бы порекомендовал вам перейти на версию "1.11.4-gke.12" или "1.11.3-gke.23", которая не имеет этой проблемы.

Другие вопросы по тегам