Как исправить ошибку dial tcp 10.96.0.1:443: тайм-аут ввода-вывода для модуля оператора, установленного через helm-rook?

Я в значительной степени добавил репо с помощью этой команды

helm repo add rook-stable https://charts.rook.io/stable

Затем я выполнил команду

helm install --namespace rook-ceph-system <NAME> <CHART VERSION>

Оператор сначала создается, но затем превращается в ошибку crashloopbackoff.

Ниже журнал.

kubectl logs  rook-ceph-operator-5bdc9cfcb9-qml5n
2020-02-26 17:42:38.863455 I | rookcmd: starting Rook v0.9.3 with arguments '/usr/local/bin/rook ceph operator'
2020-02-26 17:42:38.863570 I | rookcmd: flag values: --alsologtostderr=false, --help=false, --log-level=INFO, --log_backtrace_at=:0, --log_dir=, --logtostderr=true, --mon-healthcheck-interval=45s, --mon-out-timeout=5m0s, --stderrthreshold=2, --v=0, --vmodule=
2020-02-26 17:42:39.056154 I | cephcmd: starting operator
failed to get pod. Get https://10.96.0.1:443/api/v1/namespaces/default/pods/rook-ceph-operator-5bdc9cfcb9-qml5n: dial tcp 10.96.0.1:443: i/o timeout

Есть идеи, как это исправить?

2 ответа

Была такая же проблема с почти такой же настройкой. Кластер Kubernetes развернут с 3 ВМ (через vagrant). Бязь как сеть стручков.

Что я исправил: объявить 3 имени хоста ВМ в каждом /etc/hosts

192.168.100.51  kube1   kube1
192.168.100.52  kube2   kube2
192.168.100.53  kube3   kube3

Измените pod-network-cidr:

kubeadm init --apiserver-advertise-address=192.168.100.51 --apiserver-cert-extra-sans=192.168.100.51 --node-name kube1 --pod-network-cidr=10.10.0.0/16

Используйте тот же под-сидр в бязи:

- name: CALICO_IPV4POOL_CIDR
  value: "10.10.0.0/16"

Размещение ладьи:

git clone --single-branch --branch release-1.2 https://github.com/rook/rook.git
cd cluster/examples/kubernetes/ceph
kubectl create -f common.yaml
kubectl create -f operator.yaml
kubectl create -f cluster-test.yaml

Теперь кластер Ceph запущен и работает.

После нескольких часов гугления я решил это. Это проблема с CIDR по умолчанию, который равен 10.244.0.0/16 во время инициализации фланели. Я использую канал для сети CNI. Я решил эту проблему, отредактировав configmap canal-config с панели инструментов или используя это kubectl edit cm -n kube-system kube-flannel-cfg

      net-conf.json: |
    {
      "Network": "10.244.0.0/16",
      "Backend": {
        "Type": "vxlan"
      }
    }

Использовать kubectl get nodes -o jsonpath='{.items[*].spec.podCIDR}'чтобы получить модуль CIDR. #перейдите с 10.244.0.0/16 на свои собственные сети POD. затем удалите стручок канала. кредиты: Джун Чен

Другие вопросы по тегам