Работа Chronos не запланирована на перезапуск Zookeeper

Мой вопрос основан на проблеме, с которой сталкиваются как часть исправления ОС для машин, на которых запущены экземпляры zookeeper.
При перезапуске экземпляров Zookeeper (кворум 3) в rolling mannerChronos прекращает планирование заданий, как только один из серверов zk выходит из строя. Очевидно, что в этот период можно увидеть задания, не запланированные в веб-интерфейсе Mesos.
Для решения проблемы потребовалось перезапустить каждый экземпляр zk, а затем лидера Chronos. Однако чего я не понимаю, так это:
1. Так как существует несколько экземпляров zk, почему при сбое одного экземпляра zk в первую очередь должен произойти сбой связи между chronos и zookeeper?
2. Есть ли какие-либо предлагаемые исправления / конфигурации для mesos/zookeeper для решения этой проблемы?

Спасибо, любые предложения будут полезны!

0 ответов

Другие вопросы по тегам