Сбой запуска кластера MPI

Я попытался запустить свой кластер MPI. И я отключил брандмауэр с sudo ufw disable на каждом узле. Я установил соединение без пароля, чтобы pc0 мог соединять pc1 и pc2 через ssh без пароля.

Ub0 - это хост главного узла, ub1 и ub2 - подчиненные узлы.

Ошибка:

pc0@ub0:~/Downloads/mpich-3.0.4/examples$ mpirun -n 10 -f servers ./cpi
[proxy:0:1@ub1] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:1@ub1] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)
[proxy:0:2@ub2] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:2@ub2] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)

файл сервера:

ub0:2
pc1@ub1:2
pc2@ub2:2

Моя ОС - Ubuntu 14.04 i386. MPI - это MPICH

Теперь я не знаю, как это исправить. Спасибо за помощь!

1 ответ

Решение

Я не добавил IP и имя хоста в /etc/hosts на других узлах.

Так редактировать /etc/hostsи добавьте ip и hostname так:

192.168.0.1 node1
192.168.0.2 node2
192.168.0.3 node3

После этого скопируйте скомпилированный файл в соответствующий каталог на других узлах. Тогда все будет работать нормально.

Другие вопросы по тегам