Как восстановить кластер, когда все узлы не работают?

Если все узлы в 3-узловом кластере Percona Cluster отключены (корректно завершены или аварийно завершены), в этом блоге говорится, что когда узлы могут достигать друг друга, кластер может восстановиться автоматически. Однако запуск узлов в такой ситуации кажется сложной задачей.

Так есть ли надежный и работоспособный способ восстановления кластера в этой ситуации?

1 ответ

Изучите grastate.dat файл на все 3 узла. Какой узел имеет самый высокий порядковый номер? Вы должны загрузить этот узел. Подождите, пока он появится в сети. Затем запустите node2. Это должно быть IST от узла начальной загрузки. Затем запустите узел 3.

Золотое правило: вы всегда должны загружать самый первый узел любого кластера. Самозагрузка не стирает данные; это только запускает новый кластер.

В зависимости от версии может потребоваться установить safe_to_bootstrap в основном файле до 1 вручную.

Еще одна вещь, которую вы можете попробовать проверить, какой из наиболее продвинутых узлов запускается ниже команды на каждом узле, и проверить, какой узел имеет наибольшее значение подтвержденной транзакции.

mysqld_safe --wsrep-recover

первый узел, который имеет максимальное зафиксированное значение, затем второй и третий

Другие вопросы по тегам