Улучшение производительности записи, когда у нас есть таблица с 5 ТБ данных и 10 Regionservers

Допустим, у нас есть таблица с 5 ТБ данных с 10 Regionservers. мы хотим продолжить с путами к широко распределяемым идентификаторам строк в нашей таблице. В этом случае будет полезно увеличить количество серверов региона или уменьшить количество серверов региона? рассмотрим размер региона 256 МБ.

1 ответ

Если вы ищете более быструю запись, используйте случайный ключ строки (нагрузка записи будет распределена). Но не подходит для последовательного чтения. Вы можете начать с 10 RS, а затем, исходя из вашей пропускной способности записи, вы можете выполнять ежедневные работы по техническому обслуживанию, которые будут выполнять горячее уплотнение и уплотнение для вашего региона.

Другие вопросы по тегам