Как я могу увидеть подробную работу узлов в Rocks Cluster?
Я создал Rocks Cluster для моего школьного проекта, который является умножением матриц, с одним внешним интерфейсом и 5 другими компьютерами, которые являются узлами. Через MPI я посылаю им части матрицы, которые они используют для умножения, а затем они отправляют данные обратно. Команда, которую я запускаю:
mpirun -hostfile myhostfile ./myprogram
где myhostfile - это файл имен узлов и номеров их слотов (потоков). Моя программа работает, и я пытаюсь проанализировать ее сейчас.
У меня вопрос, как я могу увидеть работу ядра / процессора каждого узла, работающего над его задачей, работают ли все процессоры, есть ли какая-то перегрузка? Я попытался установить Vampir profiler и Intel Vtune Amplifier, но у меня есть некоторые проблемы с их подключением к моей программе с помощью этой команды выше (другие команды не позволяют мне запускать мои программы во всех потоках узла). Все, что я выполнил (чтобы убедиться, что мои узлы работают хорошо, кроме Ganglia), - это войти в узел с внешнего интерфейса и с помощью команды "top" я мог видеть, когда моя программа выполняется по количеству потоков и почти 100% загрузке ЦП. на каждом потоке.
1 ответ
Взгляните на mpstat
Без параметров он покажет совокупную нагрузку для всех ядер
mpstat -P ALL
показывает нагрузку для каждого ядра
Это даст вам статистику в реальном времени для ваших узлов:
watch pdsh -w compute-01-[01-10] mpstat
(используйте имена ваших вычислительных узлов)