Как создать Spark для запуска скрипта Scala в HDInsight?

Question

Как создать Spark для запуска скрипта Scala в HDInsight?

Я хочу выполнить скрипт Scala, используя HDInsight. Ниже в статье описывается запуск скрипта py, но не упоминается о Scala. Я следовал статье (вместо py-файла, загруженного файла Scala), но Azure DataFactory не удалось выполнить с сообщением об ошибке:

({
    "errorCode": "2312",
    "message": "Spark job failed, batch id:4",
    "failureType": "UserError"
}

https://docs.microsoft.com/en-us/azure/data-factory/transform-data-using-spark

1

azure scala apache-spark azure-data-factory hdinsight

Источник

user3360223 03 май '18 в 11:51

0 ответов

Другие вопросы по тегам azure scala apache-spark azure-data-factory hdinsight

user11054602 13 мар '19 в 17:26 2019-03-13 17:26 · Answer 1 · 2019-03-13 17:26

Если вы хотите выполнить искровой код, написанный на scala, вам нужно вызвать файл Jar. Если это слишком сложно, то вы также можете использовать блокнот данных блокнота. Дайте мне знать, если у вас возникнут проблемы

1

Источник

user11054602 13 мар '19 в 17:26

user6615402 04 мар '19 в 10:33 2019-03-04 10:33 · Answer 2 · 2019-03-04 10:33

Чтобы решить вашу проблему, вам нужно

Откройте свой конвейер в АПД
Нажмите на свою искру деятельности
Зайдите в скрипт /jar, откройте Advanced
Установите Отладочную информацию для вашей активности на Всегда.

Хотя вы сможете просматривать журналы после сбоя конвейера. Adf предоставит вам ссылку на ваши журналы. Он будет находиться в связанном хранилище в директории журнала в корне вашей фляги.

Изучите журналы, чтобы понять, что приводит к сбою приложения Spark. Посмотреть изображение из АПД