Каковы преимущества и недостатки наличия большего количества редукторов в MapReduce?

Программирование в MapReduce - это параллельная обработка, поэтому во многих случаях мы начинаем с отдельных редукторов. Каковы преимущества и недостатки наличия большего количества редукторов в MapReduce?

1 ответ

Решение

Один редуктор может работать на одном или нескольких разделах, поэтому он ограничивает распараллеливание именно тем, что он только один.

Слишком большое количество редукторов приведет к созданию слишком большого количества маленьких файлов HDFS (выходных данных), что не очень хорошо и будет оказывать давление на HDFS из-за необходимости ведения домашнего хозяйства.

Другие вопросы по тегам