Описание тега hbasestorage

1 ответ

Как я могу сканировать строки на основе шаблона строки в оболочке HBase?

Я хочу сканировать строки в HTable из оболочки HBase, используя строки, соответствующие некоторому шаблону. Например, у меня есть следующие данные таблицы: row:r1_t1 column:cf:a, timestamp=1461911995948,value=v1 row:r2_t2 column:cf:a, timestamp=1461…
29 апр '16 в 07:21
1 ответ

Массовая загрузка JSON в HBase с использованием свиньи

Привет я ищу способ загрузить большое количество документов JSON по одному в строке Каждая строка имеет формат: '{id :"id123", "c1":"v1", "c2":"v2", "c3" :"v3"...}' Каждый документ JSON может иметь неизвестное количество полей. Есть ли способ сделат…
20 июн '14 в 21:32
0 ответов

Оптимизация чтения Hbase

Я использую 5 регионов в моем кластере hbase. Я просто храню md5-хэш URL-адреса как ключ строки и только одно семейство столбцов, содержащее поле данных, которое содержит данные, соответствующие ключу (каждая строка содержит данные размером около 30…
30 янв '15 в 07:54
1 ответ

Обновление таблицы Hbase с использованием pig

Я знаю, что различные столбцы строки в HBase можно обновить с помощью Put. Я использую Pig + HBase с HBaseStorage. Я могу хранить и загружать в HBase без проблем с выражением Pig, где ключи не существуют в таблице. Но работа не удалась, когда я нача…
12 дек '13 в 03:50
0 ответов

Доступ к Windows HBase с другого компьютера Windows через Java-программу

У меня есть HBase в машине Windows. Я пытаюсь получить доступ к тому же с другой машины Windows через программу Java. Результаты с ошибкой подключения отказались. Замечания: Я попробовал то же самое в Linux, который работал отлично. Где у меня был H…
01 дек '14 в 11:29
1 ответ

Используйте HBaseStorage для загрузки из Bigtable через Pig на Dataproc

У кого-нибудь есть опыт или удалось загрузить данные из Bigtable через Pig на Dataproc с помощью HBaseStorage? Вот очень простой скрипт Pig, который я пытаюсь запустить. Он завершается с ошибкой, указывающей, что не может найти класс BigtableConnect…
0 ответов

Загрузка данных в HBase с использованием сценариев PIG

Сервисы Yarn, HBase, Hive работают с настройкой HDP 2.1 (псевдораспределенный режим). Для загрузки данных в hBase я использую встроенную поддержку поддержки PIG (org.apache.pig.backend.hadoop.hbase.HBaseStorage). Проблема в том, что он работает норм…
05 авг '14 в 12:10
1 ответ

Hbase rest api несколько вставок

Мы планируем использовать hbase rest api для выполнения вставок в таблицу hbase и хотели бы знать, есть ли способ вставить несколько столбцов в одно семейство столбцов или даже несколько семей столбцов за один вызов. Если нет, так как мы планируем в…
13 фев '19 в 19:32
1 ответ

Использование массовой загрузки HBase

Я пытаюсь импортировать некоторые данные HDFS в уже существующую таблицу HBase. Моя таблица была создана с двумя семействами столбцов и со всеми настройками по умолчанию, которые используются HBase при создании новой таблицы. Таблица уже заполнена б…
28 ноя '13 в 13:46
1 ответ

Свинья, Oozie и HBase - java.io.IOException: Нет файловой системы для схемы: hbase

Мой сценарий Pig работает нормально сам по себе, пока я не поместил его в рабочий процесс Oozie, где я получаю следующую ошибку: ERROR 2043: Unexpected error during execution. org.apache.pig.backend.executionengine.ExecException: ERROR 2043: Unexpec…
04 фев '14 в 19:32
1 ответ

PIG не может понять данные таблицы hbase

Я использую hbase(0.94.13) на одном узле для моего академического проекта. После загрузки данных в таблицы hbase я пытаюсь запустить сценарии pig(0.11.1) для данных, используя HBaseStorage. Однако это выдает ошибку, говоря IllegalArgumentException: …
12 дек '13 в 09:32
1 ответ

Node /hbase отсутствует в ZooKeeper

При запуске PredictionIO на локальном узле Hadoop (HortonWorks) я получаю следующую ошибку: Storage Backend Connections Verifying Meta Data Backend Verifying Model Data Backend Verifying Event Data Backend ERROR client.HConnectionManager$HConnection…
0 ответов

Как удалить дубликаты данных из hbase

У меня есть таблица Hbase. Схема таблицы: empid, empname,age Данные 1: Ключ - 1001 Значение - 1, Джон,26 (правильные данные) Данные 2: Ключ - 1002 Значение - 1, Джон,25 (Неверные данные. По ошибке введены пользователем.) Здесь только два столбца име…
26 май '14 в 14:21
2 ответа

Какая технология NoSQL может заменить кубы MOLAP для мгновенных запросов?

Мне было интересно, если бы вы могли сказать мне, какую базу данных NoSQL или технологии / инструменты я должен использовать для моего сценария. Мы рассчитываем заменить наши кубы OLAP, основанные на службах аналитики SQL-сервера, технологией с откр…
27 янв '15 в 07:43
2 ответа

Настройка свиной HbaseStorage

Как я могу настроить HbaseStorage для сценария свиньи? На самом деле я хочу выполнить некоторую бизнес-логику над данными, прежде чем загружать их в сценарий pig. Это было бы что-то вроде пользовательского хранилища поверх HbaseStorage. например, у …
22 ноя '13 в 17:01
1 ответ

Исключение при попытке использовать Java API для заполнения комбинации Titan-HBase

Я пытаюсь заполнить один узел Titan-HBase на моей локальной машине, используя Java API. При попытке построить Edge Indices в Titan с помощью HBase, используя следующий код: public static final String ELABEL_RESOURCE_HAS_XDOC = "_EResourceHasXDoc"; p…
21 ноя '14 в 06:14
2 ответа

Как Pig хранить строки в HBase как строки, а не байты?

Если я использую hbase shell и выпустить: put 'test', 'rowkey1','cf:foo', 'bar' scan 'test' Я буду видеть результат в виде строки, а не в байтах. Если я использую happybase и выпустить: import happybase connection = happybase.Connection('<hostnam…
14 янв '14 в 23:50
0 ответов

Свинья HBaseStorage - Как генерировать динамические имена столбцов и динамическое число классификаторов столбцов из DataBag?

А имеет отношения 1: М с Б. A = LOAD ... AS ( a_id:char ,... ); B = LOAD ... AS ( a_id:chararray ,b_id:chararray ,... ); JOINED = JOIN A BY a_id, B BY a_id; GROUPED = GROUP JOINED BY a::a_id; Это создаст DataBag со следующей схемой: {group: chararra…
06 апр '14 в 21:41
0 ответов

org.apache.hadoop.hbase.regionserver.NoSuchColumnFamilyException: таблица семейства столбцов не существует в регионе hbase:meta

Я сталкиваюсь со странной ошибкой в ​​hbase. Когда я использую этот фильтр:- SingleColumnValueFilter Filter = new SingleColumnValueFilter(CF_NAME, QF_NAME, CompareOperator.GREATER_OR_EQUAL,new BinaryComparator(Bytes.toBytes(1539340372000L))) Это не …
2 ответа

Как я могу увидеть другую версию данных Hbase, используя Hive?

Как я могу увидеть другую версию данных Hbase в Hive. Насколько я понимаю, используя HbaseStorageHandler, в Hive будет доступна только последняя версия данных Hbase. Правильно ли / правильно ли мое понимание? Есть ли способ получить доступ к другой …
07 фев '16 в 10:02