Получение дубликатов в кластере Clickhouse

Я начал кластеризацию среды на clickhouse.

Я начал с базовой конфигурации двух сегментов и одной реплики, используя концепцию распределенных таблиц.

Когда я выполняю запрос к распределенной таблице, я получаю повторяющиеся значения.

т.е. если у меня есть 43 строки, я получаю результат как 86.

Может кто-нибудь, пожалуйста, помогите, как решить эту проблему дубликатов..

Пожалуйста, найдите мои настройки файла config.xml ниже. Я использовал одинаковые настройки на обоих моих серверах Clickhouse

<http_port>8123</http_port>
    <tcp_port>9000</tcp_port>
<remote_servers>
    <perftest_3shards_1replicas>
        <shard>
            <replica>
                <host>192.168.0.132</host>
                <port>9000</port>
            </replica>
        </shard>
        <shard>
            <replica>
                <host>192.168.0.184</host>
                <port>9000</port>
            </replica>
        </shard>
        <shard>
    </perftest_3shards_1replicas>
</remote_servers>

1 ответ

Решение

Насколько я понял, вы просто поместили одни и те же данные для каждого сегмента вместо того, чтобы разделять данные между фрагментами.

Другие вопросы по тегам