Построение модели Roofline с нуля

Я недавно взял в руки модель линии крыши, и я новичок в ней.

Я пытаюсь построить один для Intel Xeon W-2133, но для одноядерных и однопоточных приложений.

Пиковое значение GFLOPS для Intel Xeon W-2133 согласно приведенным здесь данным составляет 537,6 GFLOPS. Насколько я понимаю, поскольку я работаю с одноядерными однопоточными приложениями, W-2133 имеет 6 ядер [2 потока на ядро], пиковые флопы должны упасть до 537,6 / 12 = 44,75 GFLOPS.

Пропускная способность памяти для Xeon W-2133, как показано здесь, составляет 85,3 ГБ / с.

Должна ли машина балансировать (точка, где горизонтальная линия пересекается с диагональной линией) тогда должна быть: 44,75 / 85,3 = 0,52 флопа / байт?

У меня есть следующие вопросы:

  1. Верны ли мои предположения для одноядерных однопоточных пиков?
  2. Верен ли мой метод расчета баланса машины?

Я планирую использовать эту модель для классификации других ядер как с привязкой к памяти / с привязкой к вычислениям с учетом ИИ для ядра.

Правильно ли это использовать модель линии крыши для классификации ядер?

Любая помощь будет оценена по достоинству.

0 ответов

Другие вопросы по тегам