Семейство HBase Column

Есть HBase на пяти серверах с одной таблицей, которая содержит один столбец Family, и я должен сделать несколько map Задачи по нему для каждого ключа и сохранить результат. главный вопрос:

сохранить локальность данных, какая из них лучше: создать новое семейство столбцов для таблицы существования или создать новую таблицу?

и следующий вопрос:

Документация HBase предлагает поддерживать менее трех семейств столбцов, и, как я уже сказал, у меня более десяти map задач и будет ли сохранять каждый результат в новом семействе столбцов. Что мне делать? потому что каждый map задачи отличаются от других. сохранение местности и стоимость поиска важны.

1 ответ

какой из них лучше: создайте новое семейство столбцов на существующей таблице или создайте новую таблицу

Я бы порекомендовал больше заботиться о схеме и простоте проектирования таблиц, а не пытаться взломать внутренние компоненты HBase для достижения максимальной производительности. Если информация из этих двух семейств столбцов связана и вам необходимо получить доступ к обоим CF при сканировании с уменьшением карты - сохраните их в одной таблице. Если информация на 100% независима, и вам никогда не придется сканировать их одновременно - храните их в разных таблицах. Опять же, это вопрос разработки схемы, не пытайтесь выполнять преждевременную оптимизацию.

Второй вопрос - я не понял, о чем ты, извини.

Другие вопросы по тегам