Использование part-m-00000 в множественном формате вывода в hadoop

Как использовать файл part-m-00000 в формате множественного вывода в Hadoop.

Я пытался создать несколько файлов, но не полные данные присутствуют, объединяя все несколько выходных файлов. и файл part-m -00000 равен 0 байт.

1 ответ

Вам нужно положить LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);под работу, чтобы избавиться от part-m-00000. Можете ли вы подробнее рассказать о том, что "неполные данные присутствуют"?

Другие вопросы по тегам