Сбой агрегатора memsql - как восстановить кластер

У меня есть кластер memsql с 4 дочерними агрегаторами, 30 листами и один мастер, который вышел из строя. На данный момент я не могу восстановить мастера независимо от того, что я собираюсь делать. Этот экземпляр исчез. Я продвинул один из дочерних агрегаторов для освоения.

Как только я подключаюсь к memsql и запускаю шоу базы данных; бахилы / агрегаторы... все на месте. Однако, как мне удается превратить этого ребенка в мастера? Я имею в виду, что в веб-интерфейсе мастер запускает только что запущенный кластер с нулевыми листьями. Также я не вижу никакой главной папки, созданной на дочернем агрегаторе, который был повышен.

Итак, мой вопрос, куда я иду отсюда? Например, если я хочу перезапустить весь кластер, как я собираюсь это сделать, учитывая тот факт, что из продвигаемого дочернего узла я получаю memsql-ops memsql-list Не найдены узлы MemSQL?

Как я буду выполнять типичные операции - обновление, перезапуск?

1 ответ

Похоже, вы успешно продвинули дочерний агрегатор для управления в кластере MemSQL, но MemSQL Ops потерял всю информацию о кластере, потому что основной агент Ops - который по умолчанию находился на том же хосте, что и главный агрегатор - пропал.

Я не уверен в вашей ситуации - вы продвигали нового основного агента Ops? - но в целом, если у вас есть работающий кластер MemSQL и MemSQL Ops на всех узлах кластера, но Ops не контролирует MemSQL (т. е. memsql-ops memsql-list пуст), вы должны запустить memsql-ops memsql-monitor для каждого узла MemSQL, чтобы добавить их в мониторинг Ops.

РЕДАКТИРОВАТЬ: ответ был, вы еще не продвинули новый основной агент Ops. В этом случае, вот что вам нужно сделать.

  • Запустите memsql-ops unfollow на каждом узле, кроме старого основного
  • Выберите узел, который будет новым основным - например, новый мастер-агрегатор.
  • Запустите memsql-ops, следуя -h NEW_PRIMARY_HOSTNAME на каждом узле, кроме нового основного
  • Запустите memsql-ops monitor -h NEW_MASTER_AGGREGATOR
Другие вопросы по тегам