Как сбалансировать данные между Datanodes в Hadoop?

Question

У меня есть многоузловой кластер в Hadoop, состоящий из двух машин (один узел имени и два узла данных в каждой машине).

Я использую:

hadoop fs -put dir1 hdfspath

В приведенной выше команде: данные будут распределены на обеих машинах или только на одной машине?

Какой способ балансировки: с помощью инструмента балансировки hadoop или для этого может быть автоматический способ?

hadoop hdfs hadoop2 namenode

Источник

user2197108 25 мар '17 в 10:02

1 ответ

Другие вопросы по тегам hadoop hdfs hadoop2 namenode

user2104151 27 мар '17 в 12:19 2017-03-27 12:19 · Answer 1 · 2017-03-27 12:19

Это будет зависеть от двух факторов:

Если размер хранимых данных превышает размер блока, данные будут разделены на размер блока и сохранены в разных узлах данных.