Ganglia gmetad failover
Я хочу знать, возможно ли использовать gmetad в сценарии аварийного переключения / реплики. Моя проблема заключается в следующем:
У меня есть 100 узлов, которые они общаются друг с другом с помощью многоадресной рассылки, и они синхронизируют свою информацию gmond. У меня есть отдельная машина, на которой запущен gmetad (назовем его master1), который опрашивает метрики из разных gmonds (пока что все хорошо).
Теперь я хочу быть уверен, что если master1 умрет, у меня будет второй gmetad (master2), который будет иметь те же данные. Поэтому я настроил второй gmetad, который читает те же gmonds. Теперь, если master1 умирает и снова появляется после (скажем, через 3 дня), есть ли способ получить от master2 все пропущенные данные и иметь полную временную шкалу в master1?
Если нет способа сделать это, могу ли я использовать каталог NFS и указать оба gmetads для записи rrds в один и тот же каталог?
1 ответ
Если вы работаете в многоадресной среде. Все ваши rrd файлы будут сохранены в нескольких местах. Поэтому, если вы хотите, чтобы Master1 имел полные данные временной шкалы, вы можете создать резервную копию rrds и перезапустить процессы gmond и gmetad. Ganglia снова скопирует все числа из многоадресных узлов.