Невозможно использовать sbcast для копирования файлов для вычисления узлов с главного устройства.
У меня есть кластер из 6 вычислительных узлов и 1 главного узла для академических исследовательских целей. Я пытаюсь протестировать свой кластер и убедиться, что он сможет выполнить ряд отправленных пакетных заданий. Я хочу использовать команду sbcast для копирования файла с главного узла на вычислительный узел, а затем в конечном итоге выполнить этот скопированный файл.
Я запускаю sbatch test_job, вот мой bash-скрипт:
#!/bin/bash
#SBATCH --job-name=totaltestjob
#SBATCH --output=newoutput.out
#SBATCH --error=error1.txt
#SBATCH --exclusive
#SBATCH --nodes=1
sbcast pscript.py ~
python3 pscript.py
Однако после отправки задания файл error1.txt на моем вычислительном узле гласит:
sbcast: error: Can't open 'data.txt': No such file or directory.
Я попытался предоставить файлу pscript.py разрешения 777. Я пробовал несколько путей для параметров источника и назначения, например home/user/pscript.py. Кажется, ничто не избавит вас от сообщения об ошибке выше. Кластер работает, узлы обмениваются данными друг с другом, и я успешно отправил пакетный сценарий без команды sbcast. Открыт для любых предложений. Спасибо за ваше время.
1 ответ
Я бы попробовал имя файла даже в пункте назначения, например
sbcast pscript.py ~/pscript.py
Надеюсь, поможет