Как отключить шаг установки PIG из конвейера данных AWS
Я создаю конвейер данных, используя кластер EMR в качестве ресурса. Когда сервер создается после начальной загрузки, он автоматически выполняет какой-то шаг,
enable debugging,
Install Hive
Install Pig
install Task runner
Все хорошо.
Но я хочу убрать с этого шага Install pig. Есть ли способ сделать это?
1 ответ
Этот ответ учитывает информацию об ошибке в комментариях.
Похоже, у вас установлена очень старая версия Hadoop. Посмотрите на поле hadoopVersion, определенное в объекте EmrCluster, оно, вероятно, говорит "0,20". Я бы сказал, удалите это поле и замените его на amiVersion ( http://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-emrcluster.html). Выберите более свежую версию, указанную по адресу http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/ami-versions-supported.html.