Как я могу увидеть подробную работу узлов в Rocks Cluster?

Я создал Rocks Cluster для моего школьного проекта, который является умножением матриц, с одним внешним интерфейсом и 5 другими компьютерами, которые являются узлами. Через MPI я посылаю им части матрицы, которые они используют для умножения, а затем они отправляют данные обратно. Команда, которую я запускаю:

mpirun -hostfile myhostfile ./myprogram

где myhostfile - это файл имен узлов и номеров их слотов (потоков). Моя программа работает, и я пытаюсь проанализировать ее сейчас.

У меня вопрос, как я могу увидеть работу ядра / процессора каждого узла, работающего над его задачей, работают ли все процессоры, есть ли какая-то перегрузка? Я попытался установить Vampir profiler и Intel Vtune Amplifier, но у меня есть некоторые проблемы с их подключением к моей программе с помощью этой команды выше (другие команды не позволяют мне запускать мои программы во всех потоках узла). Все, что я выполнил (чтобы убедиться, что мои узлы работают хорошо, кроме Ganglia), - это войти в узел с внешнего интерфейса и с помощью команды "top" я мог видеть, когда моя программа выполняется по количеству потоков и почти 100% загрузке ЦП. на каждом потоке.

1 ответ

Взгляните на mpstat

Без параметров он покажет совокупную нагрузку для всех ядер

mpstat -P ALL показывает нагрузку для каждого ядра

Это даст вам статистику в реальном времени для ваших узлов:

watch pdsh -w compute-01-[01-10] mpstat

(используйте имена ваших вычислительных узлов)

Другие вопросы по тегам