Глобальный снимок Cassandra
Я запускаю кластер с 3 узлами (экземпляры EC2) и фактором репликации =2. Я выполняю сценарий с первого узла, который запускает моментальный снимок nodetool на всех узлах с помощью утилиты pssh (parallel-ssh). Но данные моментального снимка для каждого узла хранятся на самом узле. Есть ли способ получить данные моментальных снимков всех узлов на узел, откуда я запустил сценарий, чтобы мой сценарий мог легко скопировать данные на S3 из одного места?
Кроме того, предположим, что у меня есть кластер из 5 узлов, и у меня есть снимки для каждого узла. Теперь я хочу восстановить эти данные в кластере из 10 узлов и кластере из 2 узлов с разными факторами репликации. Правильный ли описанный ниже процесс для восстановления?
скопируйте данные моментальных снимков со всех 5 узлов и объедините все файлы в одну папку.
запустите команду sstableloader, передав все IP-адреса (которых 10 или 2) и расположение одной папки. Будет ли это правильно разделить данные с 5 узлов на 10 или 2 узла после восстановления?
1 ответ
Я настоятельно рекомендую использовать инструмент Medusa ( doc ) для резервного копирования и восстановления вашего кластера (ов) Cassandra - он может выполнять резервное копирование данных в облачное хранилище, и вы можете восстанавливать данные в кластеры даже с различными топологиями.