Как изменить настройки памяти для Hive Activity, работающей в конвейере данных AWS?

Question

Как изменить настройки памяти для Hive Activity, работающей в конвейере данных AWS?

Пока работает один Hive Activity с помощью AWS Data Pipeline, моя активность Hive завершается с ошибкой:

Diagnostics: Container [pid=,containerID=] is running beyond physical memory limits. 
Current usage: 1.0 GB of 1 GB physical memory used;
2.8 GB of 5 GB virtual memory used. Killing container.

Когда я запустил скрипт Hive, который выполнялся Hive Activity вручную, мне пришлось выполнить его, как показано ниже:

hive \
-hiveconf tez.am.resource.memory.mb=16000 \
-hiveconf mapreduce.map.memory.mb=10240 \
-hiveconf mapreduce.map.java.opts=-Xmx8192m \
-hiveconf mapreduce.reduce.memory.mb=10240 \
-hiveconf mapreduce.reduce.java.opts=-Xmx8192m \
-hiveconf hive.exec.parallel=true
-f <hive script file path.>

С этими настройками скрипт Hive выполняется отлично.

Теперь вопрос: как передать эти настройки в Hive Activity конвейера данных AWS? Я не могу найти способ пройти -hiveconf Улей деятельности.

2

amazon-web-services hadoop hive amazon-emr amazon-data-pipeline

Источник

user194476 07 авг '17 в 11:46

1 ответ

Другие вопросы по тегам amazon-web-services hadoop hive amazon-emr amazon-data-pipeline

user5419793 25 авг '17 в 13:37 2017-08-25 13:37 · Answer 1 · 2017-08-25 13:37

Как вы называете свой скрипт улья в DataPipeline? Если вы используете ShellCommandActivity, вы сможете передавать эти -hiveconf так же, как в командной строке, и они должны нормально работать.

2

Источник

user5419793 25 авг '17 в 13:37