Как я могу увидеть другую версию данных Hbase, используя Hive?

Как я могу увидеть другую версию данных Hbase в Hive. Насколько я понимаю, используя HbaseStorageHandler, в Hive будет доступна только последняя версия данных Hbase. Правильно ли / правильно ли мое понимание?

Есть ли способ получить доступ к другой версии данных Hbase с помощью Hive??

Заранее спасибо:)

(Новое в интеграции Hbase-Hive)

2 ответа

Это будет зависеть от версии hive что вы используете. До hive 1,1, hbasetimestamps не были доступны через hive-hbase интеграция [1] (Связано: [2]). Так что ответ таков: Вы требуете hive 1.1 или выше. Надеюсь, поможет.

[1] https://issues.apache.org/jira/browse/HIVE-2828

[2] https://issues.apache.org/jira/browse/HIVE-8267

Не 100% ответ, а указания. В обычной жизни HBase всегда о особых случаях.

Вот немного устаревшая, но очень простая в понимании статья: http://hortonworks.com/blog/hbase-via-hive-part-1/

Так что практически вы можете реализовать любой InputFormat или же OutputFormat тебе нужно. Но это связано с шестернями MapReduce.

В принципе, Spark всегда может полагаться на InputFormat, поэтому вопрос касается только вашего особого случая.

Другая хорошая идея изображена здесь: http://www.slideshare.net/HBaseCon/ecosystem-session-3a Таким образом, снимки могут помочь получить состояние таблиц, в которых вы действительно нуждаетесь, и тогда вы сможете использовать любое оборудование для подключения Hive к HBase. если это соответствует стандартам.

В общем, основная идея состоит в том, чтобы настроить механизмы, которые соединяют Hive с вашими данными HBase, чтобы они применили к вам необходимые фильтры версий. Это не столько зависит от версий, сколько достаточно стабильный интерфейс.

Надеюсь, что это поможет вам.

Другие вопросы по тегам