Улей неверная проверка заголовка

Я хочу сделать запрос из файла.gz, который я импортировал в таблицу кустов, но когда я использую некоторые запросы, которые, например, требуют задания Map-Reduce: выберите количество (*) из теста; это показывает ниже ошибки:

 java.io.IOException: incorrect header check
    at org.apache.hadoop.io.compress.zlib.ZlibDecompressor.inflateBytesDirect(Native Method)
    at org.apache.hadoop.io.compress.zlib.ZlibDecompressor.decompress(ZlibDecompressor.java:228)
    at org.apache.hadoop.io.compress.DecompressorStream.decompress(DecompressorStream.java:111)
    at org.apache.hadoop.io.compress.DecompressorStream.read(DecompressorStream.java:105)

Я проверил и обнаружил, что Z LIB является кодеком компрессора по умолчанию. Я попробовал с файлом bzip, и все было в порядке. но как я могу использовать.gz файл. Как я могу изменить кодек по умолчанию, который может поддерживать файл gz?

2 ответа

У меня была похожая проблема, в моем случае проблема заключалась в том, что файлы в папке были разных форматов, как немногие были CSV, а другие паркет. как только я сохранил один формат файла, проблема была решена.

Я столкнулся с той же ошибкой, хотя я могу прочитать несколько первых записей, но нет. записей с ошибкой с той же ошибкой.

Я решил проблему, просто переименовав мой простой (несжатый) файл в.txt. Ранее мое имя файла было; Я переименовал его в.txt. Также, если вы распакуете любой файл теста, вы можете прочитать данные из него.

И если вы хотите протестировать количество записей, как описано выше, он выполнит полное сканирование, которое точно сообщит вам, правильно ли загружены данные или нет.

Я разместил это решение в другом месте

Другие вопросы по тегам