Что такое выбор коэффициента распределения при распределении вставки в инструменте стресса Кассандра?

выберите коэффициент распределения: соотношение строк, которое должен быть вставлен каждым разделом, в виде доли от общего числа возможных строк для раздела (как определено в столбцах распределения кластеризации). по умолчанию FIXED(1)/1

Может кто-нибудь объяснить, что это значит? и почему это называется "выбор дистрибутивного рациона", когда он находится во вложении дистрибутива?

http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema

1 ответ

Решение

В Кассандре данные назначаются данному узлу с помощью ключа раздела, а затем хранятся отсортированными на диске на основе ключа кластеризации в разделе.

"Коэффициент распределения" позволяет определить:

1) Сколько строк будет создано инструментом напряжения в каждом разделе,

2) Сколько строк инструмент стресса будет читать из каждого раздела (они будут упорядочены, поэтому достаточно быстро получить более одного)

В случае FIXED() это означает, что у каждого раздела будет ИСПРАВЛЕНО количество строк - если вы выберете некоторые другие опции, вы получите переменное количество строк.

Изменить, чтобы объяснить несколько строк на раздел:

Например, если у вас была модель данных, где вы собирали информацию о погоде из разных городов:

CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time)); 

В этом случае у вас есть несколько строк (по одной на каждое weather_time) в каждом разделе (station_id). Вы можете запросить все показания датчика в заданном идентификаторе станции или вы можете запросить только одно конкретное время погоды. Коэффициент распределения контролирует, сколько weather_timeу вас есть за station_id,

Другие вопросы по тегам