AWS Glue crawler - типы ключей перегородок

Я использую Spark для записи файлов в S3 в формате ORC. Также используя Athena для запроса этих данных.

Я использую следующие ключи раздела:

s3://bucket/company=1123/date=20190207

Как только я запускаю сканер Glue, чтобы запустить его, все работает, как и ожидалось, за исключением типов ключей разделов.

Crawler настраивает их в каталоге как String тип вместо int

Существует ли конфигурация для определения типа ключей раздела по умолчанию?

Я знаю, что это можно изменить вручную позже и установить конфигурацию Crawler на Add new columns only.

0 ответов

Искатели клея всегда обрабатывают ключи разделов как строку типа, и, к сожалению, нет возможности настройки для изменения этого поведения.

Другие вопросы по тегам