Пример задания Oozie работает из Hue, но не из командной строки: SparkMain not found

Я успешно запустил пример рабочего процесса Spark ("Скопировать файл, запустив Java-программу Spark"), предоставленный в редакторе рабочего процесса Hue Oozie (в виртуальной машине Cloudera 5.5.1 QuickStart).

Я сейчас пытаюсь запустить его вручную, используя oozie инструмент командной строки:

oozie job -oozie http://localhost:11000/oozie -config job.properties -run

XML рабочего процесса в основном не изменился - я скопировал его в HDFS и имею следующее job.properties:

nameNode=hdfs://localhost:8020
jobTracker=localhost:8032
oozie.wf.application.path=/user/cloudera/workflows/spark-scala/spark-scala.xml
input=/user/hue/oozie/workspaces/data/sonnets.txt
output=here

Задание принято и отображается на веб-панели управления Hue, но через несколько секунд оно прекращается, и в отчетах журнала:

Исключение средства запуска: java.lang.ClassNotFoundException: класс org.apache.oozie.action.hadoop.SparkMain не найден

В чем здесь проблема?

1 ответ

Oozie не включает библиотеки для действия Spark, по умолчанию - вам нужно добавить следующее в job.properties:

oozie.use.system.libpath=true

(Нажав на ранее успешный рабочий процесс Hue в Hue Dashboard, вы можете выбрать вкладку Configuration, чтобы увидеть свойства, предоставленные Hue)

Другие вопросы по тегам