Можем ли мы разделить DataNode и NodeManager в hadoop для запуска на разных машинах?
Просто хотелось отделить экземпляры с точки зрения затрат и разделить облачные экземпляры на основе виртуальных машин, которые могут принимать диски и другие наборы виртуальных машин, которые можно масштабировать по отношению к памяти и вычислениям.
Может быть, это сумасшедшая идея, поскольку я говорю о том, чтобы убрать секретный соус hadoop (то есть, ваши вычисления делегируются туда, где находятся данные), но в облаке, когда мы используем постоянные диски, это то, что происходит, и виртуальные машины и хранилище физически разделены,