Могу ли я конвертировать CSV-файлы из Amazon S3 в формат Parquet, используя Athena и не используя Amazon EMR
Я хотел бы преобразовать файлы данных csv, которые сейчас находятся на Amazon S3, в формат Parquet с помощью Amazon Athena и перенести их обратно в Amazon S3 без помощи Amazon EMR. Возможно ли это сделать? Кто-нибудь испытывал нечто подобное?
1 ответ
Amazon Athena может запрашивать данные, но не может конвертировать форматы данных.
Вы можете использовать Amazon EMR для преобразования в форматы столбцов. Шаги:
- Создать внешнюю таблицу, указывающую на исходные данные
- Создайте внешнюю таблицу назначения с
STORED AS PARQUET
INSERT OVERWRITE <destination_table> SELECT * FROM <source_table>