Как проверить данные, скопированные из одной таблицы в пространство ключей в таблицу в другом пространстве ключей в Cassandra?

Мы копируем данные из семейства столбцов в пространстве ключей в другое пространство ключей в том же центре обработки данных. И мы хотим проверить, соответствует ли размер cf или нет. из скопированных записей такой же, как и у исходного cf . Есть ли способ измерить размер cf во всем кластере?

1 ответ

AFAIK Cassandra не поддерживает количество таблиц / кластеров. В целом, это зависит от размера вашего набора данных:

  • маленький набор данных: беги select count(*) from <table> limit <max_number_of_rows>,
  • большой набор данных: напишите скрипт с использованием драйвера cassandra, который сканирует всю таблицу (с разбивкой по страницам), считая все строки
  • большой набор данных, 2-й способ: использовать cqlsh copy выгрузить таблицу в CSV-файл, а затем считать строки.
  • очень большой набор данных: используйте соединитель Spark + Cassandra для распределения нагрузки по всему кластеру.
Другие вопросы по тегам