Файлы DynamoDB для восстановления на определенный момент времени на паркет
Параметр экспорта восстановления DynamoDB на момент времени в разделе «Экспорт и потоки», похоже, выгружает файл в формате json.gz, если он выбран с помощью «DynamoDB JSON» в расширенных настройках. Когда я пытаюсь преобразовать этот файл (json.gz) в паркет, используя клей ETL studio. Однако, когда мы выбираем тип входного файла как JSON в задании Glue ETL studio, это не удается. Каков самый простой способ постепенно выгружать данные DynamoDB в формат паркета в S3, заботясь о проблемах нехватки памяти (Lambda/Glue ETL)?