Получение дубликатов в кластере Clickhouse
Я начал кластеризацию среды на clickhouse.
Я начал с базовой конфигурации двух сегментов и одной реплики, используя концепцию распределенных таблиц.
Когда я выполняю запрос к распределенной таблице, я получаю повторяющиеся значения.
т.е. если у меня есть 43 строки, я получаю результат как 86.
Может кто-нибудь, пожалуйста, помогите, как решить эту проблему дубликатов..
Пожалуйста, найдите мои настройки файла config.xml ниже. Я использовал одинаковые настройки на обоих моих серверах Clickhouse
<http_port>8123</http_port>
<tcp_port>9000</tcp_port>
<remote_servers>
<perftest_3shards_1replicas>
<shard>
<replica>
<host>192.168.0.132</host>
<port>9000</port>
</replica>
</shard>
<shard>
<replica>
<host>192.168.0.184</host>
<port>9000</port>
</replica>
</shard>
<shard>
</perftest_3shards_1replicas>
</remote_servers>
1 ответ
Решение
Насколько я понял, вы просто поместили одни и те же данные для каждого сегмента вместо того, чтобы разделять данные между фрагментами.