Очистка Кассандры на нескольких серверах одновременно
У нас есть большой кластер Cassandra 18 серверов (на одном сервере около 5T данных)
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - Мы добавили новые узлы после этой документации.
После добавления новых серверов мы начали процесс очистки данных (очистка nodetool).
В документации советуем: После запуска всех новых узлов запустите очистку nodetool на каждом из ранее существующих узлов, чтобы удалить ключи, больше не принадлежащие этим узлам. Дождитесь завершения очистки на одном узле, прежде чем делать следующий)
Но очистка для одного сервера в нашем случае занимает около 2 - 3 дней. У меня вопрос, могу ли я начать уборку сразу на нескольких серверах, 2 или 3 ...
Или это может привести к потере данных?
Еще немного информации.
Мы используем cassandra 2.0.13 с vnodes. Также мы храним файлы в блонд в Кассандре.
Коэффициент репликации = 3
1 ответ
Очистка не затрагивает другие узлы, поэтому ее можно безопасно выполнять параллельно. Однако вам может потребоваться запускать его по одному за раз, чтобы снизить влияние на производительность, поскольку для очистки может потребоваться много дискового ввода-вывода.