Кодовая база сжатия Cassandra
Я хочу знать, сколько именно байтов хранится на диске, когда я вставляю новый столбец в семейство столбцов Кассандры. Моя главная проблема заключается в том, что мне нужно знать эту информацию, когда столбцы сжаты с помощью Snappy, я знаю вычисление необработанных байтов, но из-за изменчивости данных я не могу надлежащим образом приблизить степень сжатия. Любая информация о том, где найти это количество байтов в базе кодов Cassandra, будет приветствоваться.
Заранее спасибо.
1 ответ
Сжатие никогда не может дать гарантированные коэффициенты сжатия. Лучшее, что вы можете получить - это среднее соотношение для выборочных данных.
Итак, загрузите образцы данных, вставьте их в тестовый экземпляр и измерьте использование диска.
У вас могут быть данные, которые очень плохо сжимаются в Snappy и на самом деле приводят к большему использованию на диске, чем к хранению необработанных байтов.
Когда дело доходит до сжатия ваших данных, есть одно-единственное правило: ИЗМЕРЕНИЕ