Развертывание Spark в облаке Azure

Можно ли развернуть спарк-код в облаке Azure без компонента пряжи? заранее спасибо

2 ответа

Решение

Я не думаю, что можно развернуть кластер HDInsight без YARN. См. Документацию HDInsight.

YARN - менеджер ресурсов для Hadoop. Есть ли какая-то особая причина, по которой вы не хотели бы использовать YARN при работе с кластером HDInsight Spark?

Если вы хотите использовать автономный режим, вы можете изменить местоположение главного URL при отправке задания с помощью команды Spark-submit.

У меня есть несколько примеров в моем репо с Spark-submit как в локальном режиме, так и в кластере HDInsight https://github.com/NileshGule/learning-spark

Вы можете обратиться к

Да, вы можете развернуть кластер Apache Spark в Azure HDInsight без Yarn.

Кластеры Spark в HDInsight включают следующие компоненты, которые доступны в кластерах по умолчанию.

1) Spark Core. Включает Spark Core, Spark SQL, потоковые API Spark, GraphX ​​и MLlib.

2) Анаконда

3) Ливия

4) Блокнот Jupyter

5) Блокнот Zeppelin

Кластеры Spark в HDInsight также предоставляют драйвер ODBC для подключения к кластерам Spark в HDInsight из таких инструментов BI, как Microsoft Power BI и Tableau.

Обратитесь к следующим сайтам для получения дополнительной информации,

Создайте кластер Apache Spark в Azure HDInsight

Введение в Spark на HDInsight

Другие вопросы по тегам