Выполнение запросов HIVE непосредственно из входных файлов S3
Я использую Интерактивный сеанс Hive в Elastice Map Reduce для запуска Hive. Ранее я загружал данные из S3 в таблицы Hive. Теперь я хочу запустить некоторые сценарии для входных файлов S3 без загрузки данных в таблицы Hive.
Возможно ли это? Если да, то как этого достичь?
1 ответ
Вы можете выполнять запросы к данным прямо в S3.
CREATE EXTERNAL TABLE mydata (key STRING, value INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\n' LOCATION 's3n://mys3bucket/';
или похожие