Загрузка данных в базу данных Greenplum с использованием MapReduce или Sqoop

Я хочу попробовать загрузить данные в Greenplum, используя mapreduce или sqoop. На данный момент способы загрузить greenplum db из hdfs - создать внешнюю таблицу с помощью gphdfs, а затем загрузить внутреннюю таблицу. Я хочу попробовать решение для прямой загрузки данных в greenplum с помощью sqoop или mapreduce. Мне нужны некоторые входные данные о том, как я могу действовать в этом направлении. Не могли бы вы помочь мне?

2 ответа

Хотя я и не sqoop, я сейчас на экспериментальной стадии использования внешних таблиц Greenplum для загрузки из hdfs. Пока что, похоже, выполняет.

Что касается Sqoop, экспорт Sqoop поможет достичь этого.

http://www.tutorialspoint.com/sqoop/sqoop_export.htm

Другие вопросы по тегам