Как я могу увидеть другую версию данных Hbase, используя Hive?
Как я могу увидеть другую версию данных Hbase в Hive. Насколько я понимаю, используя HbaseStorageHandler, в Hive будет доступна только последняя версия данных Hbase. Правильно ли / правильно ли мое понимание?
Есть ли способ получить доступ к другой версии данных Hbase с помощью Hive??
Заранее спасибо:)
(Новое в интеграции Hbase-Hive)
2 ответа
Это будет зависеть от версии hive
что вы используете. До hive
1,1, hbase
timestamps
не были доступны через hive-hbase
интеграция [1] (Связано: [2]). Так что ответ таков: Вы требуете hive
1.1 или выше. Надеюсь, поможет.
Не 100% ответ, а указания. В обычной жизни HBase всегда о особых случаях.
Вот немного устаревшая, но очень простая в понимании статья: http://hortonworks.com/blog/hbase-via-hive-part-1/
Так что практически вы можете реализовать любой InputFormat
или же OutputFormat
тебе нужно. Но это связано с шестернями MapReduce.
В принципе, Spark всегда может полагаться на InputFormat, поэтому вопрос касается только вашего особого случая.
Другая хорошая идея изображена здесь: http://www.slideshare.net/HBaseCon/ecosystem-session-3a Таким образом, снимки могут помочь получить состояние таблиц, в которых вы действительно нуждаетесь, и тогда вы сможете использовать любое оборудование для подключения Hive к HBase. если это соответствует стандартам.
В общем, основная идея состоит в том, чтобы настроить механизмы, которые соединяют Hive с вашими данными HBase, чтобы они применили к вам необходимые фильтры версий. Это не столько зависит от версий, сколько достаточно стабильный интерфейс.
Надеюсь, что это поможет вам.