Каков правильный порядок перезапуска кластера для восстановления на определенный момент времени?
У меня кластер со смешанной рабочей нагрузкой в нескольких центрах обработки данных. Я выполнил команду sstableloader для таблиц, которые хочу восстановить, используя снэпшоты, резервные копии которых я сделал. Я добавил файлы журнала фиксации, которые я скопировал из архива в каталог восстановления на всех узлах. Я обновил файл commitlog_archiving.properties этими конфигами. Каков правильный способ и порядок перезапуска узлов моего кластера? Применимы ли эти соображения и к перезапуску?
2 ответа
Если вы все это сделали, я не думаю, что порядок имеет большое значение. Тем не менее , вам следует сначала перезапустить начальные узлы , чтобы узлы в кластере имели общую точку входа в кластер, чтобы найти путь обратно и правильно воссоединиться.
Как правило, мы рекомендуем сначала перезапустить начальные узлы в DC, прежде чем другие узлы, чтобы распространение слухов происходило быстрее, особенно для больших кластеров (произвольно 15+ узлов). Важно отметить, что перезагрузка не требуется, если вы восстанавливали данные с помощью
sstableloader
.
Если вы просто выполняете скользящий перезапуск, то порядок контроллеров домена не имеет значения. Но это имеет значение, если вы запускаете кластер из холодного отключения, что означает, что все узлы отключены, а кластер полностью отключен.
При запуске из холодного выключения важно начать с «Analytics DC» (узлы, работающие в
Analytics
режим, то есть с включенным Spark), потому что это упрощает выбор мастера Spark. Предполагая, что репликация для пространств ключей Analytics настроена с рекомендуемым коэффициентом репликации 3, вам нужно будет запустить 2 или 3 узла, начиная с начальных значений, в идеале с интервалом в 1 минуту, потому что
LeaderManager
требуется кворум узлов для выбора мастера Spark.
Мы рекомендуем оставлять контроллеры домена с узлами, работающими в
Search
режим (с включенным Solr) последним для удобства, чтобы все остальные контроллеры домена были в рабочем состоянии до того, как кластер начнет принимать запросы поиска от приложений. Ваше здоровье!