Невозможно использовать sbcast для копирования файлов для вычисления узлов с главного устройства.

У меня есть кластер из 6 вычислительных узлов и 1 главного узла для академических исследовательских целей. Я пытаюсь протестировать свой кластер и убедиться, что он сможет выполнить ряд отправленных пакетных заданий. Я хочу использовать команду sbcast для копирования файла с главного узла на вычислительный узел, а затем в конечном итоге выполнить этот скопированный файл.

Я запускаю sbatch test_job, вот мой bash-скрипт:

      #!/bin/bash

#SBATCH --job-name=totaltestjob
#SBATCH --output=newoutput.out
#SBATCH --error=error1.txt
#SBATCH --exclusive
#SBATCH --nodes=1


sbcast pscript.py  ~
python3 pscript.py

Однако после отправки задания файл error1.txt на моем вычислительном узле гласит:

      sbcast: error: Can't open 'data.txt': No such file or directory. 

Я попытался предоставить файлу pscript.py разрешения 777. Я пробовал несколько путей для параметров источника и назначения, например home/user/pscript.py. Кажется, ничто не избавит вас от сообщения об ошибке выше. Кластер работает, узлы обмениваются данными друг с другом, и я успешно отправил пакетный сценарий без команды sbcast. Открыт для любых предложений. Спасибо за ваше время.

1 ответ

Я бы попробовал имя файла даже в пункте назначения, например

      sbcast pscript.py  ~/pscript.py

Надеюсь, поможет

Другие вопросы по тегам