Загрузить большие тома с S3 на локальный компьютер? - s3distcp

Question

Загрузить большие тома с S3 на локальный компьютер? - s3distcp

В настоящее время использую distcp Это медленный процесс, который занимает до 4:16 минут на копирование журналов за 1 час, в то время как написанная мной пользовательская функция занимает всего 16 секунд. Учитывая, что Amazon предоставляет s3distcp примеры, включающие журналы, я подумал, чтобы попробовать и проверить его производительность.

Я знаю, что это возможно с distcp но можно ли использовать s3distcp на локальном компьютере скопировать большие объемы данных (потенциально более 100 ГБ) в кластер hfs на локальном компьютере без использования EMR?

Amazon и последующие учебники и статьи только ссылки s3distcp способности как шаг в EMR..

2

amazon-web-services hadoop hdfs distcp

Источник

user3063935 08 июл '15 в 21:26

0 ответов

Другие вопросы по тегам amazon-web-services hadoop hdfs distcp