HBase - это база данных Hadoop (столбчатая). Используйте его, когда вам нужен случайный доступ для чтения / записи в реальном времени к вашим большим данным. Целью этого проекта является размещение очень больших таблиц - миллиарды строк X миллионы столбцов - на кластерах обычного оборудования.

HBase - это нереляционная, распределенная, управляемая версиями, ориентированная на столбцы база данных с открытым исходным кодом, созданная по образцу Bigtable от Google и написанная на Java. Bigtable: распределенная система хранения для структурированных данных, разработанная Чангом и др. Подобно тому, как Bigtable использует распределенное хранилище данных, предоставляемое файловой системой Google, HBase предоставляет возможности, подобные Bigtable, поверх распределенной файловой системы Hadoop (HDFS). HBase включает: Он разработан в рамках проекта Apache Hadoop Apache Software Foundation и работает поверх HDFS (распределенная файловая система Hadoop), обеспечивая возможности, подобные Bigtable, для Hadoop.

  • Удобные базовые классы для поддержки заданий Hadoop MapReduce с таблицами HBase, включая каскадные модули, модули источника и приемника улей и скребков
  • Отправка предиката запроса через сканирование на стороне сервера и получение фильтров
  • Оптимизация для запросов в реальном времени
  • Шлюз Thrift и веб-сервис REST с поддержкой XML, Protobuf и параметры кодирования двоичных данных
  • Расширяемая оболочка на основе jruby (JIRB)
  • Поддержка экспорта метрик через подсистему метрик Hadoop в файлы или Ganglia; или через JMX