4 уровня высокой доступности в PCF, BOSH обрабатывает сбойные экземпляры или контролирует?
По моему мнению, как упоминается в 4 уровнях высокой доступности PCF, при сбое экземпляра (процесса) Monit должен его распознать и перезапустить. И тогда он просто отправит отчет в BOSH. Но если вся ВМ выйдет из строя, ответственность за ее распознавание и перезапуск несет BOSH.
С этим убеждением я ответил на один вопрос: https://djitz.com/guides/pivotal-cloud-foundry-pcf-certification-exam-review-questions-and-answers-set-4-logging-scaling-and-high-availability/
По моему мнению, ответ на этот вопрос должен быть вариант 3, но он говорит, что я не прав, и ответ должен быть вариант 2. Теперь я в замешательстве. Поэтому, пожалуйста, помогите мне, если моя вера неверна.
1 ответ
BOSH отвечает за создание нового экземпляра для неисправной виртуальной машины. Я знаю, что в интернете для этого не так много информации, но если у вас есть шанс, есть учебник по множественному освещению, в который вы можете записаться. Там инструктор очень хорошо объяснил высокую доступность. Но вы также можете получить идею высокого уровня из документов PCF.
Мониторинг процессов PCF использует агент BOSH, monit, для мониторинга процессов на виртуальных машинах компонентов, которые работают вместе, чтобы поддерживать работу ваших приложений, таких как nsync, BBS и Cell Rep. Если monit обнаруживает сбой, он перезапускает процесс и уведомляет БОШ агент на ВМ. Агент BOSH уведомляет монитор работоспособности BOSH, который запускает ответчики с помощью плагинов, таких как почтовые уведомления или пейджинг.
Воскрешение для виртуальных машин BOSH обнаруживает присутствие виртуальной машины, прослушивая сообщения пульса, которые отправляются агентом BOSH каждые 60 секунд. Монитор здоровья BOSH прислушивается к сердцебиению. Когда монитор работоспособности обнаруживает, что виртуальная машина не отвечает, он передает предупреждение компоненту Resurrector. Если Resurrector включен, он отправляет IaaS запрос на создание нового экземпляра виртуальной машины, чтобы заменить тот, который вышел из строя.