Точная мощность для документов Elasticsearch

Я хочу знать об алгоритме (hyperloglog++) эластичного поиска, который используется для уникальных подсчетов.

Может ли установка порога точности для определенного значения дать мне точный уникальный счет до этого порога без учета ограничений памяти?

Использует ли алгоритм линейный счетчик до порога точности и после этого переключается на счетчик гиперлога?

1 ответ

Да, он использует линейный счет в хэш-таблице до порога точности. Вы также можете увидеть это в соответствующем коде.

Но также помните, что пороговое значение точности по умолчанию составляет 3000, и вы можете установить его максимум до 40000. Установка более высокого значения фактически ограничит его до 40 000. Так что нет точных результатов для более высокой мощности.

Другие вопросы по тегам