Как сделать запрос на создание сжатого паркетного файла?

Я сделал программу изменения формата данных, используя Apache Drill.

В этой программе, если CSV-файл конвертировать в JSON, JSON-файл выполнен в формате hdfs.

Но я хочу, чтобы выходной файл был сжат.

Является ли это возможным?? Если это возможно, как это сделать??

1 ответ

Да, вы можете установить тип сжатия в Apache Drill.

Из документации,

Вы можете установить параметры планирования и выполнения запросов Drill для каждого кластера, на уровне системы или сеанса. Параметры, установленные на уровне сеанса, применяются только к запросам, выполняемым во время текущего соединения Drill. Параметры, установленные на системном уровне, влияют на всю систему и сохраняются между перезапусками. Настройки уровня сеанса переопределяют настройки уровня системы."

ALTER SYSTEM SET `option_name` = value;

имя опции store.parquet.compression Вы можете выбрать тип сжатия из допустимых значений: snappy, gzip, none

Больше информации здесь.

Другие вопросы по тегам