Использование part-m-00000 в множественном формате вывода в hadoop
Как использовать файл part-m-00000 в формате множественного вывода в Hadoop.
Я пытался создать несколько файлов, но не полные данные присутствуют, объединяя все несколько выходных файлов. и файл part-m -00000 равен 0 байт.
1 ответ
Вам нужно положить LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);
под работу, чтобы избавиться от part-m-00000. Можете ли вы подробнее рассказать о том, что "неполные данные присутствуют"?