Почему Афина для QuickSight, если QuickSight прямой запрос S3
Может быть, я что-то упускаю, но я не могу понять, какую выгоду я получу, если соединю Афину с Quicksight над S3 напрямую с Quicksight. Пожалуйста, помогите мне понять это.
1 ответ
Amazon S3 - это хранилище объектов, созданное для хранения и извлечения любого объема данных. В основном, он имеет некоторые необработанные данные или неструктурированные данные (в определенном формате файла .csv
или же .tsv
).
Amazon Athena использует управляемый каталог данных для хранения информации и схем о базах данных и таблицах, которые вы создаете для своих данных, хранящихся в Amazon S3. Итак, Афина знает о данных и их структуре (т.е. о какой-то схеме) в S3.
Кроме того, QuickSight может напрямую подключаться к базе данных Athena и запрашивать данные для анализа. Когда вы подключаетесь к базе данных Athena, вы, скорее всего, будете обрабатывать структурированные или полуструктурированные данные.
Файлы манифеста Amazon S3 не требуются, если источником данных является Amazon Athena.
Некоторые ограничения при подключении к S3 напрямую:-
Размер файла, указанного в манифесте, не может превышать 1 ГБ, общий размер всех указанных файлов не может превышать 10 ГБ, а общее количество указанных файлов не может превышать 1000.
Приведенные выше ограничения недоступны при создании набора данных с использованием данных Amazon Athena.
Еще одна особенность при создании набора данных с использованием данных Amazon Athena:-
Вы можете напрямую анализировать данные без загрузки или загрузки в SPICE и анализировать данные.
Заключение:-
Если вы ничего не сделали с файлами S3, вы можете просто использовать QuickSight, используя S3 в качестве набора данных.
В случае, если вы загрузили данные S3 в Athena, вы можете использовать Athena в качестве набора данных для QuickSight.
Используя Athena или любой другой источник данных, вы получите несколько преимуществ и сможете преодолеть некоторые ограничения (например, размер файла), упомянутые выше.