Использование cassandra-lucene-index на столбцах высокой мощности
У меня есть сценарий использования, который требует выбора либо https://github.com/Stratio/cassandra-lucene-index, либо Elastic Search on Cassandra. Я более ориентирован на реализацию Stratio, поскольку она не требует создания / управления кластерами ES. Однако приведенный ниже сценарий ставит реализацию решения в сложную ситуацию.
Индекс Cassandra lucene создается в столбце высокой мощности, например, colA в ключевом пространстве Test (Keyspace имеет более 10000 уникальных записей для colA), а следующий запрос выполняется с использованием Cassandra-lucene-index.
select * from Test where colA like “1%”
Теперь вышеприведенный запрос потребует попадания во все узлы кластера Cassandra, поскольку индексы Cassandra Lucene являются локальными индексами.
Итак, будет ли производительность запроса в таком сценарии хорошо масштабироваться с помощью Cassandra-lucene-index по сравнению с результатами, возвращаемыми из ElasticSearch Cluster с подачей данных из Cassandra по мере увеличения данных в пространстве ключей?
Версия инструментов: Кассандра 3.10, Кассандра-Люцен-Индекс Stratio 3.10