Как проверить данные, скопированные из одной таблицы в пространство ключей в таблицу в другом пространстве ключей в Cassandra?
Мы копируем данные из семейства столбцов в пространстве ключей в другое пространство ключей в том же центре обработки данных. И мы хотим проверить, соответствует ли размер cf или нет. из скопированных записей такой же, как и у исходного cf . Есть ли способ измерить размер cf во всем кластере?
1 ответ
AFAIK Cassandra не поддерживает количество таблиц / кластеров. В целом, это зависит от размера вашего набора данных:
- маленький набор данных: беги
select count(*) from <table> limit <max_number_of_rows>
, - большой набор данных: напишите скрипт с использованием драйвера cassandra, который сканирует всю таблицу (с разбивкой по страницам), считая все строки
- большой набор данных, 2-й способ: использовать
cqlsh copy
выгрузить таблицу в CSV-файл, а затем считать строки. - очень большой набор данных: используйте соединитель Spark + Cassandra для распределения нагрузки по всему кластеру.