Монго-искровой соединитель, считывающий разное количество документов из коллекции каждый раз

Я использую монго-искровой соединитель для создания rdd в scala. Я добавил следующее в build.sbt

libraryDependencies += "org.mongodb.spark" % "mongo-spark-connector_2.11" % "2.0.0"

Followinf - мой спаркконф:

val sparkConf = new `SparkConf().setAppName("stanfordner").set("spark.driver.allowMultipleContexts","true").set("spark.serializer", "org.apache.spark.serializer.KryoSerializer").set("spark.kryoserializer.buffer.max", "1g").set("spark.mongodb.input.uri", "mongodb://127.0.0.1/").set("spark.mongodb.input.database", "db").set("spark.mongodb.input.collection", "coll")`

Я попытался создать RDD из коллекции Монго, используя:

val rdd = sc.loadFromMongoDB()

val rdd = MongoSpark.load(sc) Но каждый раз, когда я запускаю код, я получаю rdd с разным количеством документов. Я не понимаю, почему это происходит. Любая помощь будет оценена.

0 ответов

Другие вопросы по тегам