Как узнать, какой это файл Kind of Sequence?
Я новичок в Hadoop и наткнулся на несколько файлов Sequence. Когда я читаю Sequence File, есть 3 способа создать файл последовательности. Теперь у меня есть файл последовательности, как узнать, что это за файл последовательности. Как мне прочитать мета-информацию об этом? Мне это нужно, потому что у меня есть файл последовательности, и ожидается, что я создаю подобный файл последовательности.
Есть ли какая-либо команда hadoop, которую я могу использовать, чтобы проверить эту информацию?
1 ответ
SequenceFile - это плоский файл, состоящий из двоичных пар ключ / значение.
SequenceFile.Reader
действует как мост и может читать любой из форматов SequenceFile.
Вам не нужно упоминать формат SequenceFileSequenceFile.Reader
по умолчанию экземпляр считывателя получит эти данные и распакует файл в соответствии с кодеком, найденным в формате файла.
Проверьте примеры здесь: