Что такое выбор коэффициента распределения при распределении вставки в инструменте стресса Кассандра?
выберите коэффициент распределения: соотношение строк, которое должен быть вставлен каждым разделом, в виде доли от общего числа возможных строк для раздела (как определено в столбцах распределения кластеризации). по умолчанию FIXED(1)/1
Может кто-нибудь объяснить, что это значит? и почему это называется "выбор дистрибутивного рациона", когда он находится во вложении дистрибутива?
http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema
1 ответ
В Кассандре данные назначаются данному узлу с помощью ключа раздела, а затем хранятся отсортированными на диске на основе ключа кластеризации в разделе.
"Коэффициент распределения" позволяет определить:
1) Сколько строк будет создано инструментом напряжения в каждом разделе,
2) Сколько строк инструмент стресса будет читать из каждого раздела (они будут упорядочены, поэтому достаточно быстро получить более одного)
В случае FIXED() это означает, что у каждого раздела будет ИСПРАВЛЕНО количество строк - если вы выберете некоторые другие опции, вы получите переменное количество строк.
Изменить, чтобы объяснить несколько строк на раздел:
Например, если у вас была модель данных, где вы собирали информацию о погоде из разных городов:
CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time));
В этом случае у вас есть несколько строк (по одной на каждое weather_time) в каждом разделе (station_id). Вы можете запросить все показания датчика в заданном идентификаторе станции или вы можете запросить только одно конкретное время погоды. Коэффициент распределения контролирует, сколько weather_time
у вас есть за station_id
,