Java Spark, как сохранить JavaPairRDD<HashSet <String>, HashMap<String, Double >> в файл?

Question

Java Spark, как сохранить JavaPairRDD<HashSet <String>, HashMap<String, Double >> в файл?

Я получил этоJavaPairRDD<HashSet<String>, HashMap<String, Double>>"СДР после некоторых сложных агрегаций, хочу сохранить результат в файл. Я считаю, saveAsHadoopFile хороший API для этого, но у меня проблемы с заполнением параметров для saveAsHadoopFile(path, keyClass, valueClass, outputFormatClass, CompressionCodec), Кто-нибудь может помочь?

0

java apache-spark hadoop java-pair-rdd

Источник

user4681361 27 апр '18 в 04:47

1 ответ

Другие вопросы по тегам java apache-spark hadoop java-pair-rdd

user7204279 27 апр '18 в 06:12 2018-04-27 06:12 · Answer 1 · 2018-04-27 06:12

Вы можете использовать следующую функцию, а затем проанализировать ее до желаемого результата.

rdd.saveAsTextFile ("hdfs:///complete_path_to_hdfs_file/");

но если вы хотите использовать API-интерфейс saveAsHadoopFile, можно использовать следующий метод.

saveAsHadoopFile(complete_path_to_file, HashSet.class, HashMap.class, TextOutputFormat.class)

Вы также можете использовать HadoopOutputFormat.class как последний параметр

Для получения дополнительной информации, вы можете обратиться по этой ссылке HadoopFile