Карта ParVector не работает параллельно

У меня есть немного кода, как:

val data = List(obj1, obj2, obj3, obj4, ...).par.map { ... }

и ParVector составляет примерно 12 элементов. Я заметил, что вся моя работа выполняется в основном потоке, поэтому я проследил трассировку стека и обнаружил, что в следующей строке (по ссылке ниже) ifParallel имеет значение false (из CanBuildFrom). Любые намеки на то, почему это ложно, и что я могу сделать, чтобы помочь этому?

https://github.com/paulp/scala-full/blob/2.9.0.1/src/library/scala/collection/parallel/ParIterableLike.scala

2 ответа

Решение

Произошла ошибка в версии scala, которую я использовал. С тех пор это было исправлено.

Я не могу воспроизвести это:

case class Obj(i: Int)
val list = List(1 to 12 map Obj: _*)
def f(o: Obj) = { println("f " + o); Obj(o.i + 1) }
val data = list.par.map(f)

Печать:

f Obj(1)
f Obj(2)
f Obj(3)
f Obj(4)
f Obj(5)
f Obj(6)
f Obj(7)
f Obj(8)
f Obj(10)
f Obj(11)
f Obj(12)
f Obj(9)
// data: ParVector(Obj(2), Obj(3), Obj(4), Obj(5), Obj(6), Obj(7), Obj(8), Obj(9),
// Obj(10), Obj(11), Obj(12), Obj(13))

Смотрите scala: параллельные коллекции не работают? для сходных симптомов и где добавление некоторой искусственной задержки показало, что вещи могут происходить параллельно.

Как вы узнаете ifParallel идет по другому пути? Я сделаю это:

scala> collection.parallel.ParSeq.canBuildFrom[Int].isParallel
res0: Boolean = true

Кроме того, какова ценность Runtime.getRuntime.availableProcessors?

Другие вопросы по тегам