Примерный алгоритм для top-k запроса в улье?
Каждый в улье мы используем
select word,count(*) as cnt from table group by word order by cnt limit N
для топ-N запроса.
Поскольку мы знаем, что скорость не высокая, я узнаю о каком-то приблизительном алгоритме запроса top-k, таком как алгоритм counttsketch или другой алгоритм.
Можем ли мы добавить приблизительный алгоритм в куст для ускорения запроса top-k?