Где выполняется функция Apache Spark reductionByWindow?

Я пытаюсь изучить Apache Spark и не могу понять из документации, как работают оконные операции.

У меня есть два рабочих узла, и я использую Kafka Spark Utils для создания DStream из темы.

На этот DStream я применяю map функция и reductionByWindow,

Я не могу понять, если reductionByWindow выполняется на каждого работника или водителя.

Я искал в Google без какого-либо результата.

Кто-нибудь может мне объяснить?

1 ответ

Решение

Как получение, так и обработка данных происходят на рабочих узлах. Драйвер создает приемники (на рабочих узлах), которые отвечают за сбор данных, и периодически запускает задания для обработки собранных данных. Все остальное в основном стандартные RDD и обычные задания Spark.

Другие вопросы по тегам