Проблема сравнения производительности между OpenMPI и Intel MPI

Я работаю с C++ MPI-кодом, который при компиляции с openMPI занимает 1 мин 12 с и 16 с Intel MPI (я проверял его и на других входах, разница аналогична. Оба скомпилированных кода дают правильный ответ). Я хочу понять, почему такая большая разница во времени выполнения. И что можно сделать, чтобы уменьшить время выполнения с помощью openMPI (GCC).

Я использую ОС CentOS 6 с процессором Intel Haswell. Я использую следующие флаги для компиляции.

openMPI (GCC): mpiCC -Wall -O3

Я также пробовал -march=native -funroll-loops. Это не имеет большого значения. Я также попробовал опцию -lm. Я не могу скомпилировать для 32 бит.

Intel MPI: mpiicpc -Wall -O3 -xhost

-xhost saves 3 seconds in run time.

0 ответов

Другие вопросы по тегам