Проект Apache Tez™ направлен на создание инфраструктуры приложения, которая позволяет создавать сложный ориентированный ациклический граф задач для обработки данных. В настоящее время он построен на базе Apache Hadoop YARN.

Две основные темы дизайна для Tez:

Расширение возможностей конечных пользователей за счет: Выразительных API-интерфейсов определения потоков данных Гибкой модели времени выполнения ввода-процессора-вывода Не зависит от типа данных Упрощение развертывания Эффективность выполнения Повышение производительности по сравнению с Map Reduce Оптимальное управление ресурсами Планирование реконфигурации во время выполнения Решения динамических физических потоков данных

[Подробнее см. По этой ссылке][1]: https://tez.apache.org/