Драйвер Spark иногда не перезапускается, даже если отправлено в режиме супервизора и кластера

У меня в Кубернетесе 2 мастера по искрам и 3 рабочих по искрам. В настоящее время я отправляю искровые задания в режиме развертывания кластера с включенным контролируемым флагом. Теперь, чтобы проверить, возрождается ли драйвер на другом искателе или нет, я удаляю модуль искателя, содержащий драйвер. Это приводит к удалению стручка и возрождению водителя в другом стручке искровщика. Но это иногда не удается, а иногда и работает. Проверка указывается в коде, который я отправляю в Spark.

С точки зрения кода: я пытался использовать потоковый контекст прямо из sparkcontext. Это привело к лучшему возрождению водителя в другой капсуле. Я также попытался использовать sparksession для создания потокового контекста. Это иногда приводит к возрождению водителя, а иногда водителя просто убивают.

С точки зрения JVM: я пытался остановить процесс, выполняющий отправку Spark. Это приводит к возрождению водителя в другой капсуле.

Спарк отправить:

/opt/spark/bin/spark-submit --deploy-mode cluster --total-executor-cores 3 --driver-memory 2G --supervise --driver-cores 1 --executor-cores 2 --executor-memory 8G  --class com.CheckpointTest.app.SparkIngestion --master spark://sparkmaster-0.sparkmaster.default.svc.cluster.local:7077,sparkmaster-1.sparkmaster.default.svc.cluster.local:7077 http://http-server-clientsvc:5000/download/fs-ingestion-svc.jar;

Драйвер не перезапускается иногда.

0 ответов

Другие вопросы по тегам