Каковы преимущества и недостатки наличия большего количества редукторов в MapReduce?
Программирование в MapReduce - это параллельная обработка, поэтому во многих случаях мы начинаем с отдельных редукторов. Каковы преимущества и недостатки наличия большего количества редукторов в MapReduce?
1 ответ
Решение
Один редуктор может работать на одном или нескольких разделах, поэтому он ограничивает распараллеливание именно тем, что он только один.
Слишком большое количество редукторов приведет к созданию слишком большого количества маленьких файлов HDFS (выходных данных), что не очень хорошо и будет оказывать давление на HDFS из-за необходимости ведения домашнего хозяйства.