Параллельное сканирование Dynamodb с использованием API Table.scan в Java

Question

Параллельное сканирование Dynamodb с использованием API Table.scan в Java

Буду признателен за помощь всем, кто знаком с работой DynamoDB. Мне нужно выполнить сканирование на большой таблице DynamoDB. Я знаю, что операция сканирования DynamoDBClient ограничена размером возвращаемых данных в 1 МБ. Применимо ли такое же ограничение к операции Table.scan? Дело в том, что операция Table.scan возвращает вывод типа "ItemCollection<ScanOutcome>", в то время как сканирование DynamoDBClient возвращает вывод ScanResult, и мне не ясно, работают ли эти операции аналогичным образом или нет.

Я проверил этот пример: http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/ScanJavaDocumentAPI.html, но он не содержит никаких подсказок об использовании последнего возвращенного ключа.

Мои вопросы: Нужно ли делать циклические вызовы до тех пор, пока lastreturnedkey не станет нулевым, если я использую Table.scan? Если да, как мне получить последний ключ? Если нет, как я могу обеспечить нумерацию страниц? Любые ссылки на примеры кода приветствуются. Я потратил некоторое время на поиски примеров, но большинство из них используют либо DynamoDBClient, либо DynamoDBMapper, хотя мне нужно вместо этого использовать объекты таблиц и индексов.

Спасибо!

2

java amazon-dynamodb aws-sdk full-table-scan

Источник

user180309 06 сен '16 в 10:40

1 ответ

Другие вопросы по тегам java amazon-dynamodb aws-sdk full-table-scan

user1022807 12 фев '17 в 11:59 2017-02-12 11:59 · Answer 1 · 2017-02-12 11:59

Если вы перебираете вывод Table.scan()SDK сделает пагинацию за вас.

1

Источник

user1022807 12 фев '17 в 11:59