Как настроить hive.Connection() для прохождения настроек Hive, которые я хочу?
Я использую Spyder 3.2.8 на Ubuntu 17.10. Я хотел бы передать Hive, который находится на удаленном кластере, чтобы дать имена именам столбцов, используя set hive.cli.print.header=true;
команда.
Вот что я сделал до сих пор:
con = hive.Connection(host="name",
port=some port,
username="usr",
configuration='hive.cli.print.header = True')
Как правильно настроить конфигурацию, я не могу найти ни одного рабочего примера.
1 ответ
Вы можете попробовать что-то вроде этого
conn = hive.Connection(host="host", port="port", username="user",password="passwd",auth='LDAP',configuration={'hive.auto.convert.join':' ложь ' 'mapred.mappers.tasks':'25','mapred.job.shuffle.input.buffer.percent':'0,50','mapreduce.map.memory.mb':'12000',' MapReduce.reduce.memory.mb':'12000','mapred.reduce.child.java.opts':'-Xmx12000m','mapred.map.child.java.opts':'-Xmx12000m','hive.exec.reducers.bytes.per.reducer':'104857600','hive.optimize.skewjoin':'правда'})