Формат ввода Hadoop
При подготовке к экзамену на хадуп наткнулся ниже на вопрос, на который я не мог понять правильный ответ, не уверен в правильности вопроса.
Дан каталог файлов со следующей структурой: номер строки, символ табуляции, строка:
Example:
1. abialkjfjkaoasdfjksdlkjhqweroij
2. kadf jhuwqounahagtnbvaswslmnbfgy
3. kjfteiomndscxeqalkzhtopedkfslkj
Вы хотите отправить каждую строку как одну запись вашему Mapper. Какой InputFormat вы бы использовали для завершения строки: setInputFormat (________. Class);
A. DBInputFormat
B. KeyValueTextInputFormat
C. SequenceFileInputFormat
D. SequenceFileAsTextInputFormat
Ответ: C
Но, по мнению, для достижения этого либо KeyValueTextInputFormat
или же SequenceFileAsTextInputFormat
также может быть использован.
1 ответ
Это определенно не C или D. Потому что они требуют, чтобы входные данные были файлами последовательности, а это не так, насколько я мог понять.