Построение модели Roofline с нуля
Я недавно взял в руки модель линии крыши, и я новичок в ней.
Я пытаюсь построить один для Intel Xeon W-2133, но для одноядерных и однопоточных приложений.
Пиковое значение GFLOPS для Intel Xeon W-2133 согласно приведенным здесь данным составляет 537,6 GFLOPS. Насколько я понимаю, поскольку я работаю с одноядерными однопоточными приложениями, W-2133 имеет 6 ядер [2 потока на ядро], пиковые флопы должны упасть до 537,6 / 12 = 44,75 GFLOPS.
Пропускная способность памяти для Xeon W-2133, как показано здесь, составляет 85,3 ГБ / с.
Должна ли машина балансировать (точка, где горизонтальная линия пересекается с диагональной линией) тогда должна быть: 44,75 / 85,3 = 0,52 флопа / байт?
У меня есть следующие вопросы:
- Верны ли мои предположения для одноядерных однопоточных пиков?
- Верен ли мой метод расчета баланса машины?
Я планирую использовать эту модель для классификации других ядер как с привязкой к памяти / с привязкой к вычислениям с учетом ИИ для ядра.
Правильно ли это использовать модель линии крыши для классификации ядер?
Любая помощь будет оценена по достоинству.