База данных для сканирования большого диапазона
Я ищу хорошее решение для хранения данных (одноразовая вставка, без обновлений) и запросов к ним на больших диапазонах. Я предполагаю, что СУБД не годятся для меня, так как я ищу большую и масштабируемую базу данных.
Я использовал Cassandra для этой цели и достиг 70 мкс на строку, используя предложение и IN для нескольких ключей раздела. Я использую широкие ряды, и каждая строка занимает пару мегабайт.
Это нормально или я что-то не так делаю? Я не мог найти какие-либо реальные цифры в Интернете.
Мой кластер состоит из трех компьютеров EC2 типа c3.8xarge (32 виртуальных ЦП и 60 ГБ ОЗУ)
Мне интересно, является ли Кассандра лучшим решением для меня, и если да, могу ли я ускорить процесс поиска.
РЕДАКТИРОВАТЬ: Мой клиентский компьютер также C3.8xararge EC2. Таким образом, связь между клиентом и Cassandra составляет не менее 10 Гбит / с.
РЕДАКТИРОВАТЬ-2: Полное сжатие кластера не помогло сократить время чтения.