Сжатие с архивами Hadoop

Мне интересно, как сжать вывод hadoop archive, В настоящее время все, что я получаю, это вывод одинакового размера, который мне не очень помогает, так как я ищу способ сжать мои исходные данные и сохранить их на некоторое время. Эти данные представлены в виде файлов XML, и они на самом деле очень хорошо сжимаются.

Я хотел бы использовать архивы hadoop, как я видел в одном из ответов на этот вопрос Hadoop: сжатие файла в HDFS?

На самом деле, я хотел использовать другие ответы на этот вопрос, но по какой-то причине кто-то был достаточно умен, чтобы удалить демонстрационные банки, упомянутые в других ответах. Я сейчас подумываю получить эти банки самостоятельно из Интернета, но мне все равно хотелось бы услышать, что архив hasoop можно использовать для сжатия.

Спасибо

0 ответов

Другие вопросы по тегам