Java Spark, как сохранить JavaPairRDD<HashSet <String>, HashMap<String, Double >> в файл?

Я получил этоJavaPairRDD<HashSet<String>, HashMap<String, Double>>"СДР после некоторых сложных агрегаций, хочу сохранить результат в файл. Я считаю, saveAsHadoopFile хороший API для этого, но у меня проблемы с заполнением параметров для saveAsHadoopFile(path, keyClass, valueClass, outputFormatClass, CompressionCodec), Кто-нибудь может помочь?

1 ответ

Вы можете использовать следующую функцию, а затем проанализировать ее до желаемого результата.

rdd.saveAsTextFile ("hdfs:///complete_path_to_hdfs_file/");

но если вы хотите использовать API-интерфейс saveAsHadoopFile, можно использовать следующий метод.

saveAsHadoopFile(complete_path_to_file, HashSet.class, HashMap.class, TextOutputFormat.class)

Вы также можете использовать HadoopOutputFormat.class как последний параметр

Для получения дополнительной информации, вы можете обратиться по этой ссылке HadoopFile

Другие вопросы по тегам