Ошибка MPI из-за тайм-аута при установлении соединения с удаленным процессом

Я пытаюсь запустить тест NAS-UPC, чтобы изучить его профиль. UPC использует MPI для связи с удаленными процессами.

Когда я запускаю тест с 64 процессами, я получаю следующую ошибку

upcrun -n 64 bt.C.64
"Timeout in making connection to remote process on <<machine name>>" 

Кто-нибудь может сказать мне, почему эта ошибка происходит?

1 ответ

Решение

Это, вероятно, означает, что вы не можете порождать удаленные процессы - upcrun делегирует это отдельному механизму, который может задействовать ваш планировщик (если есть). я предполагаю, что вы зависите от удаленного доступа типа ssh, и это не удается, вероятно, потому что у вас нет настроенных ключей, доверия агента или хоста. вы можете SSH к своим удаленным узлам без пароля? нормальная среда на удаленных узлах (пути и т. д.)?

"upcrun -v" может осветить проблему, даже не обращаясь к странице справочника;)

Другие вопросы по тегам