DynamoDB InputFormat для Hadoop

Question

DynamoDB InputFormat для Hadoop

Я должен обработать некоторые данные, которые сохраняются в Amazon Dynamo DB, используя Hadoop Map Reduce.

Я искал в интернете Hadoop InputFormat для DB Dynamo и не смог его найти. Я не знаком с Dynamo DB, поэтому я предполагаю, что есть какая-то хитрость, связанная с DynamoDB и Hadoop? Если есть где-нибудь реализация этого формата ввода, не могли бы вы поделиться им?

3

amazon-web-services hadoop amazon-dynamodb mapreduce elastic-map-reduce

Источник

user432665 22 окт '12 в 21:22

2 ответа

Решение

Не удалось найти InputFormat, который вы могли бы использовать непосредственно в MapReduce. Но вот статья AWS HowTo: Использование Amazon Elastic MapReduce с DynamoDB (Guest Post) для запуска заданий MarReduce с использованием Hive.

1

Источник

user614157 23 окт '12 в 05:02

Другие вопросы по тегам amazon-web-services hadoop amazon-dynamodb mapreduce elastic-map-reduce

user432665 29 окт '12 в 18:36 2012-10-29 18:36 · Accepted Answer · 2012-10-29 18:36

После долгих поисков я обнаружил DynamoDBInputFormat и DynamoDBOutputFormat в одной из библиотек Amazon.

На amazon упругое сокращение карты есть библиотека, названная hive-bigbird-handler, которая содержит формат ввода и вывода для DynamoDB. Полные имена классов: org.apache.hadoop.hive.dynamodb.write.DynamoDBOutputFormat и org.apache.hadoop.hive.dynamodb.read.DynamoDBInputFormat

Я надеюсь, что эти занятия будут полезны для сообщества.