Каков правильный порядок перезапуска кластера для восстановления на определенный момент времени?

У меня кластер со смешанной рабочей нагрузкой в ​​нескольких центрах обработки данных. Я выполнил команду sstableloader для таблиц, которые хочу восстановить, используя снэпшоты, резервные копии которых я сделал. Я добавил файлы журнала фиксации, которые я скопировал из архива в каталог восстановления на всех узлах. Я обновил файл commitlog_archiving.properties этими конфигами. Каков правильный способ и порядок перезапуска узлов моего кластера? Применимы ли эти соображения и к перезапуску?

2 ответа

Если вы все это сделали, я не думаю, что порядок имеет большое значение. Тем не менее , вам следует сначала перезапустить начальные узлы , чтобы узлы в кластере имели общую точку входа в кластер, чтобы найти путь обратно и правильно воссоединиться.

Как правило, мы рекомендуем сначала перезапустить начальные узлы в DC, прежде чем другие узлы, чтобы распространение слухов происходило быстрее, особенно для больших кластеров (произвольно 15+ узлов). Важно отметить, что перезагрузка не требуется, если вы восстанавливали данные с помощью sstableloader.

Если вы просто выполняете скользящий перезапуск, то порядок контроллеров домена не имеет значения. Но это имеет значение, если вы запускаете кластер из холодного отключения, что означает, что все узлы отключены, а кластер полностью отключен.

При запуске из холодного выключения важно начать с «Analytics DC» (узлы, работающие в Analyticsрежим, то есть с включенным Spark), потому что это упрощает выбор мастера Spark. Предполагая, что репликация для пространств ключей Analytics настроена с рекомендуемым коэффициентом репликации 3, вам нужно будет запустить 2 или 3 узла, начиная с начальных значений, в идеале с интервалом в 1 минуту, потому что LeaderManager требуется кворум узлов для выбора мастера Spark.

Мы рекомендуем оставлять контроллеры домена с узлами, работающими в Searchрежим (с включенным Solr) последним для удобства, чтобы все остальные контроллеры домена были в рабочем состоянии до того, как кластер начнет принимать запросы поиска от приложений. Ваше здоровье!

Другие вопросы по тегам