Описание тега google-cloud-composer
Cloud Composer — это продукт Google Cloud Platform (GCP). По сути, это «хостинг/управление Apache Airflow».
Продукт позволяет создавать, планировать и отслеживать задания, каждое задание представлено в виде DAG (ориентированного ациклического графа) различных операторов. Вы можете использовать встроенные определения операторов Airflow и/или определить свои собственные на чистом Python.
Хотя технически вы можете выполнять обработку данных непосредственно в задаче (экземпляр оператора), чаще вам потребуется, чтобы задача вызывала какую-то обработку в другой системе (которая может быть чем угодно — контейнером, BigQuery, Spark и т. д.). Часто вы будете ждать завершения этой обработки с помощью оператора датчика воздушного потока, возможно, запускать дополнительные зависимые задачи и т. д.
Пока Cloud Composer находится под управлением, вы можете применять различные настройки, например указывать, какие модули pip устанавливать, аппаратные конфигурации, переменные среды и т. д. Cloud Composer позволяет переопределять некоторые, но не все параметры конфигурации Airflow.
Дополнительные технические сведения: Cloud Composer создаст кластер Kubernetes для каждой созданной вами среды Airflow. Здесь будут выполняться ваши задачи, но вам не нужно ими управлять. Вы поместите свой код в определенное ведро в облачном хранилище, и Cloud Composer будет синхронизировать его оттуда.
Документация по воздушному потоку: https://airflow.apache.org/docs/stable/
Документация по Cloud Composer: https://cloud.google.com/composer