sge может запустить только одну задачу в одном узле

Я построил SGE в кластере из четырех узлов для исходного кода. Операционная система в Centos7. И когда я отправлял простую задачу в кластер, я обнаружил, что на одном узле выполнялась только одна задача. В чем проблема? Вот мой код задачи:

sleep 60
echo "done"

и это мой cmd для отправки задач:

DIR=`pwd`
option=""
for((i=0;i<5;i++));do
  qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.sh
  sleep 1
done

при запуске qstat -f он показывает: введите описание изображения здесь

1 ответ

Учитывая сообщение об ошибке при сбое задания, потому что: "не удается найти неиспользуемый add_grp_id". Вы должны проверить, что задано для gid_range в конфигурации sge (как глобальной, так и, если есть, по одному на хост). Это должен быть диапазон неиспользуемых групповых идентификаторов. По крайней мере, столько раз, сколько вы хотите рабочих мест на узле.

Если это не так, попробуйте запустить qalter -w v и qalter -w p на одном из заданий в очереди, чтобы узнать, почему они не запускаются.

Другие вопросы по тегам