Реализация HyperLogLog с помощью Spark Batch + Cassandra
Я ищу реализовать алгоритм HyperLogLog для подсчета отдельных пользователей для разных сегментов аудитории (или фильтров). Я пользуюсь Cassandra + Spark batch. Хотите знать, если Кассандра предоставляет какую-либо поддержку для типа HyperLogLog.
Я не смог найти плагин или что-нибудь связанное с этим, кроме http://vilkeliskis.com/blog/2013/12/28/hacking_cassandra.html который является отличной попыткой, но не завершен.
Спасибо за любые возможные советы!