Примерный алгоритм для top-k запроса в улье?

Каждый в улье мы используем

select word,count(*) as cnt from table group by word order by cnt limit N

для топ-N запроса.
Поскольку мы знаем, что скорость не высокая, я узнаю о каком-то приблизительном алгоритме запроса top-k, таком как алгоритм counttsketch или другой алгоритм.
Можем ли мы добавить приблизительный алгоритм в куст для ускорения запроса top-k?

algorithm hive approximate

Источник

user1562158 21 авг '12 в 07:28

0 ответов

Другие вопросы по тегам algorithm hive approximate