Как настроить hive.Connection() для прохождения настроек Hive, которые я хочу?

Я использую Spyder 3.2.8 на Ubuntu 17.10. Я хотел бы передать Hive, который находится на удаленном кластере, чтобы дать имена именам столбцов, используя set hive.cli.print.header=true; команда.

Вот что я сделал до сих пор:

con = hive.Connection(host="name", 
                      port=some port, 
                      username="usr",
                      configuration='hive.cli.print.header = True')

Как правильно настроить конфигурацию, я не могу найти ни одного рабочего примера.

1 ответ

Вы можете попробовать что-то вроде этого

conn = hive.Connection(host="host", port="port", username="user",password="passwd",auth='LDAP',configuration={'hive.auto.convert.join':' ложь ' 'mapred.mappers.tasks':'25','mapred.job.shuffle.input.buffer.percent':'0,50','mapreduce.map.memory.mb':'12000',' MapReduce.reduce.memory.mb':'12000','mapred.reduce.child.java.opts':'-Xmx12000m','mapred.map.child.java.opts':'-Xmx12000m','hive.exec.reducers.bytes.per.reducer':'104857600','hive.optimize.skewjoin':'правда'})

Другие вопросы по тегам