Распределение данных AWS Kinesis Firehose по s3 по полезной нагрузке

Я использую AWS-Kinesis-Firehose для передачи данных на S3, а затем использую их для Athena.

Я пытаюсь анализировать события из разных игр, чтобы Афина не исследовала много данных. Я хотел бы разделить данные s3 с помощью идентификатора для каждой игры, поэтому пока я не нашел решения, так как Firehose получает данные из разных игр.

Кто-нибудь знает как это сделать?

Спасибо, Хави.

2 ответа

Возможно, вы можете использовать Amazon Kinesis Analytics для разделения входящих потоков Firehose на отдельные выходные потоки на основе некоторой логики, такой как идентификатор игры.

Он может принимать KinesisFirehoseInput и отправлять данные в KinesisFirehoseOutput.

Однако документация по ограничениям, по- видимому, предполагает, что в приложении может быть только 3 выходных пункта назначения, поэтому этого будет недостаточно.

Вы можете отправить свой трафик в основной поток FireHose, а затем использовать лямбда-функцию для разделения данных на несколько потоков FireHose - по одному для каждой игры, которая сохранит данные в отдельной папке / корзине.

Другие вопросы по тегам