Ошибка MPI из-за тайм-аута при установлении соединения с удаленным процессом
Я пытаюсь запустить тест NAS-UPC, чтобы изучить его профиль. UPC использует MPI для связи с удаленными процессами.
Когда я запускаю тест с 64 процессами, я получаю следующую ошибку
upcrun -n 64 bt.C.64
"Timeout in making connection to remote process on <<machine name>>"
Кто-нибудь может сказать мне, почему эта ошибка происходит?
1 ответ
Это, вероятно, означает, что вы не можете порождать удаленные процессы - upcrun делегирует это отдельному механизму, который может задействовать ваш планировщик (если есть). я предполагаю, что вы зависите от удаленного доступа типа ssh, и это не удается, вероятно, потому что у вас нет настроенных ключей, доверия агента или хоста. вы можете SSH к своим удаленным узлам без пароля? нормальная среда на удаленных узлах (пути и т. д.)?
"upcrun -v" может осветить проблему, даже не обращаясь к странице справочника;)