Сжатие с архивами Hadoop
Мне интересно, как сжать вывод hadoop archive
, В настоящее время все, что я получаю, это вывод одинакового размера, который мне не очень помогает, так как я ищу способ сжать мои исходные данные и сохранить их на некоторое время. Эти данные представлены в виде файлов XML, и они на самом деле очень хорошо сжимаются.
Я хотел бы использовать архивы hadoop, как я видел в одном из ответов на этот вопрос Hadoop: сжатие файла в HDFS?
На самом деле, я хотел использовать другие ответы на этот вопрос, но по какой-то причине кто-то был достаточно умен, чтобы удалить демонстрационные банки, упомянутые в других ответах. Я сейчас подумываю получить эти банки самостоятельно из Интернета, но мне все равно хотелось бы услышать, что архив hasoop можно использовать для сжатия.
Спасибо