Развертывание apache-spark: автономные VS несколько виртуальных машин

Question

Развертывание apache-spark: автономные VS несколько виртуальных машин

У меня есть одна машина для развертывания Spark, Hadoop и Tachyon. Будут ли ускоренные операции из hdfs/tachyon на одном узле со всеми ядрами / ОЗУ или несколькими узлами ВМ, равномерно разделяющими ресурсы? Рам < 200GB.

Производительность и масштабируемость широковещательной рассылки в Spark довольно старая, но предполагает, что увеличение сетевого трафика может быть сильным негативом в проблеме всех против виртуальных машин.

0

apache-spark hadoop hdfs tachyon

Источник

user398969 21 май '15 в 17:12

1 ответ

Другие вопросы по тегам apache-spark hadoop hdfs tachyon

user572083 21 май '15 в 18:09 2015-05-21 18:09 · Answer 1 · 2015-05-21 18:09

Вероятно, лучше иметь несколько экземпляров рабочих, в то время как это увеличивает нагрузку на сеть, а производительность JVM при действительно большой куче невелика.

0

Источник

user572083 21 май '15 в 18:09