Как преобразовать файл XLSX в CSV с помощью AWS Glue Databrew

Можно ли загрузить файл Excel в корзину S3 (входное местоположение = файл XLSX), создать набор данных Databrew из этого файла Excel и создать рецепт в AWS Glue Databrew, который преобразует этот файл Excel в файл CSV (выходное местоположение, которое содержит преобразованный файл CSV)?

1 ответ

Короткий ответ на ваш вопрос: да, но не так, как вы ожидаете. Но вот один из способов -

  1. Создайте набор данных на основе файла или файлов XLSX (как вы упомянули в своем вопросе).
  2. Откройте проект, используя этот набор данных (ссылка на документы , если вам нужны подробности)
  3. Примените преобразования к набору данных в соответствии с вашими потребностями. Если у вас нет никаких преобразований для применения, просто переименуйте столбец на данный момент. Вам нужно иметь хотя бы одно преобразование для следующего шага.
  4. Нажмите «Создать задание» в правом верхнем углу страницы проекта.
  5. Введите все необходимые данные (ссылка на официальные документы ). Для «Настройки вывода задания» выберите следующее, как показано на снимке экрана.
    1. Тип файла как "CSV" (выбрано по умолчанию)
    2. Разделитель как «Запятая (,)» (выбрано по умолчанию)
  6. Нажмите «Создать и запустить задание».

Пожалуйста, обрати внимание -

Стоит отметить, что если у вас есть один файл или всего пара файлов, которые необходимо преобразовать в CSV, то есть более простые способы конвертировать файл из XLSX в CSV с помощью программного обеспечения MS Excel — просто откройте файл и нажмите «Сохранить». as" в формате CSV, как показано на снимке экрана ниже.

Другие вопросы по тегам