Описание тега apache-falcon

Apache Falcon - платформа для управления каналами и обработки данных

Из документов:

Falcon - это система обработки и управления кормом, предназначенная для облегчения конечным потребителям встроенной обработки и управления кормом в кластерах hadoop.

Зачем?

  • Устанавливает взаимосвязь между различными данными и элементами обработки в среде Hadoop
  • Службы управления каналами, такие как хранение каналов, репликации между кластерами, архивирование и т. Д.
  • Легко внедрить новые рабочие процессы / конвейеры, с поддержкой поздней обработки данных, политик повторов
  • Интеграция с metastore / каталогом, таким как Hive/HCatalog
  • Предоставить уведомление конечному клиенту на основе доступности групп каналов (логическая группа связанных каналов, которые могут использоваться вместе)
  • Позволяет использовать варианты для локальной обработки в colo и глобальных агрегациях
  • Записывает информацию о происхождении для каналов и процессов