Как Spark выполняет ввод / вывод?

Насколько я понимаю, Spark использует параллельный ввод-вывод для чтения файлов. Этот вывод приходит из других ответов переполнения стека.

Мой вопрос заключается в том, позволяет ли спарк читать данные, используя независимый подход или коллективный подход? Другими словами, каждый работник читает набор данных или рабочие взаимодействуют друг с другом и сотрудничают, чтобы эффективно читать данные?

2 ответа

Работники общаются водителем, а каждый работник обрабатывает свои данные

У каждого работника Apache Spark есть Исполнители, Работники могут быть развернуты в распределенном или автономном режиме.
Каждый работник обрабатывает свои собственные данные, которые он обрабатывает. Для более подробной информации смотрите этот ответ или эту ссылку

Другие вопросы по тегам