TKGI – Как перезапустить Bosh Director по SSH на виртуальной машине Bosh
Я использую TKGI для развертывания своих приложений в кластерах. Внезапно мы потеряли доступ к нашим кластерам. Мы успешно можем войти в TKGI, но когда мы пытаемся получить учетные данные для определенного кластера, выполнив следующую команду.
pks get-credentials abc-cluster
Он зависает на определенное время и выдает следующую ошибку.
Error: There was a problem completing your request. Please contact your operations team providing the following information: service: p.pks, service-instance-guid: f617fec2-2748-48cb-98c8-17dc4e63f666, broker-request-id: a15f4a9b-4b1f-4bfe-a4d6-7f58f77a3359, operation: bind - error-message: gathering deployment list Cannot get the list of deployments: Finding deployments: Performing request GET 'https://x.x.x.x:25555/deployments?exclude_configs=true': Performing GET request: Requesting token via client credentials grant: Performing request POST 'https://x.x.x.x:8443/oauth/token': Performing POST request: Retry: Post https://x.x.x.x:8443/oauth/token: dial tcp x.x.x.x:8443: connect: connection refused
поэтому мы попытались выполнить команды bosh, чтобы выяснить, в чем проблема. Именно тогда мы поняли, что не можем подключиться к Bosh Director из нашего Ops Manager, и, к сожалению, мы потеряли парольную фразу и не имеем доступа к консоли Ops Manager. Мы можем подключиться к виртуальной машине Bosh только по SSH с соответствующим pem-файлом.
Мы также видим, что в виртуальной машине Bosh на порту 25555 не работает служба, как ожидалось TKGI. Мы получаем ответ ниже, когда выполняем
sudo lsof -i -P -n
не уверен, куда идти дальше. Есть подсказки?