Выполнение запросов HIVE непосредственно из входных файлов S3

Я использую Интерактивный сеанс Hive в Elastice Map Reduce для запуска Hive. Ранее я загружал данные из S3 в таблицы Hive. Теперь я хочу запустить некоторые сценарии для входных файлов S3 без загрузки данных в таблицы Hive.

Возможно ли это? Если да, то как этого достичь?

1 ответ

Вы можете выполнять запросы к данным прямо в S3.

CREATE EXTERNAL TABLE mydata (key STRING, value INT) ROW FORMAT DELIMITED FIELDS  TERMINATED BY '\n' LOCATION 's3n://mys3bucket/';

или похожие

Другие вопросы по тегам