Производительность поиска в базе данных

Question

Производительность поиска в базе данных

У меня есть hbase, размещающий около 80G данных (около 110 миллионов строк). Каждая строка имеет переменное количество столбцов. Я хочу в первую очередь использовать эту базу данных для поиска ключевых слов (около 10 миллионов поисков) при минимальном времени. Каков наилучший способ сделать это? Способен ли остальной интерфейс звездных врат обрабатывать большое количество соединений?

1

hbase stargate

Источник

user262107 21 июн '14 в 19:04

1 ответ

Другие вопросы по тегам hbase stargate

user2599782 11 авг '14 в 20:14 2014-08-11 20:14 · Answer 1 · 2014-08-11 20:14

Так как 10 миллионов просмотров - это возможно, лучше использовать memcache или redis. Потому что 80 ГБ достаточно для хранения в памяти.

Если вы настаиваете на hbase, то вам поможет Bloom Filter. Также использование пула соединений и параллельных потоков будет полезно для повышения производительности.