Объемная загрузка HBase и вторичный индекс

Я хочу использовать массовую загрузку для загрузки результатов Hive (хранящихся в виде файлов hdfs) в HBase. И я хочу установить вторичный индекс для некоторых полей. Идея приходит ко мне, когда я нахожу, что хорошо работает сопроцессор с методом prePut. Когда я вставляю данные в таблицу, существующую на HBase, таблица индекса получает индекс. Но когда я используйте официальную массовую загрузку, таблица индекса стала нулевой. Хорошо. Есть ли способы сделать это с помощью BulkHDF-файлов и вторичного индекса?

0 ответов

Другие вопросы по тегам