В некоторых процессах параллельная обработка на нескольких ядрах не выполняется
У меня есть следующая проблема на 64-ядерном мульти-кластере. Я пытаюсь запустить файл bash, который выглядит так:
nohup command01 > nohup.output01 &
nohup command02 > nohup.output02 &
...
nohup command50 > nohup.output50 &
Однако, если я смотрю на выходные файлы или использую команду htop, кажется, что только около 40 из 50 моих заданий выполняются. И, кажется, просто случайно, какие из 50 были выбраны / обработаны. Другие были запущены (в выходных файлах записано несколько строк), но внезапно остановились. Я пытался уменьшить число до 30,20... всегда не хватает некоторых работ. Сейчас я бегу первые 10, запустив те, я делаю еще 10 - это похоже на работу (20 рабочих мест параллельно). Но это раздражает. Итак, мой вопрос: как это может случиться, что не все 50 заданий могут обрабатываться параллельно на 64-ядерном многокластерном устройстве, и я могу сделать что-нибудь, чтобы это заработало? Я не могу найти ошибку в выходных данных. Спасибо за любую помощь, Б.