Загрузка данных в базу данных Greenplum с использованием MapReduce или Sqoop
Я хочу попробовать загрузить данные в Greenplum, используя mapreduce или sqoop. На данный момент способы загрузить greenplum db из hdfs - создать внешнюю таблицу с помощью gphdfs, а затем загрузить внутреннюю таблицу. Я хочу попробовать решение для прямой загрузки данных в greenplum с помощью sqoop или mapreduce. Мне нужны некоторые входные данные о том, как я могу действовать в этом направлении. Не могли бы вы помочь мне?
2 ответа
Хотя я и не sqoop, я сейчас на экспериментальной стадии использования внешних таблиц Greenplum для загрузки из hdfs. Пока что, похоже, выполняет.
Что касается Sqoop, экспорт Sqoop поможет достичь этого.