MIT StarCluster и S3

Question

MIT StarCluster и S3

Я пытаюсь запустить задание mapreduce на точечных экземплярах. Я запускаю свои экземпляры с помощью StarClusters и его плагина hadoop. У меня нет проблем загрузить данные, затем поместить их в HDFS, а затем скопировать результат обратно из HDFS. У меня вопрос, есть ли способ загрузить данные непосредственно из s3 и отправить результат обратно в s3? (Я не хочу вручную загружать данные из s3 в HDFS и передавать результат из HDFS в s3, есть ли способ сделать это в фоновом режиме)?

Я использую стандартный MIT StarCluster AMI

0

amazon-web-services amazon-s3 hadoop amazon-ec2 starcluster

Источник

user2042037 02 май '15 в 00:40

1 ответ

Решение

Другие вопросы по тегам amazon-web-services amazon-s3 hadoop amazon-ec2 starcluster

user2042037 04 май '15 в 06:36 2015-05-04 06:36 · Accepted Answer · 2015-05-04 06:36

Вы не можете сделать это, но вы можете написать скрипт для этого. например, вы можете использовать: hadoop distcp s3n://ID:key@mybucket/file /user/root/file, чтобы поместить файл напрямую в hdfs из s3

1

Источник

user2042037 04 май '15 в 06:36