Расчет фактического флопа / ядра при использовании фактической пропускной способности памяти
Я хочу рассчитать фактическое количество mflop / s / core, используя следующую информацию:
Я измерил фактический объем пропускной способности памяти каждого ядра в 1 узле, который составляет 4371 МБ / с.
Я также измерил mflop / s / core на одном узле, если я использую только одно ядро на узле (в этом случае вся память узла будет доступна для этого ядра), результат равен 2094.45. Поэтому я измерил пропускную способность памяти, которая была доступна для этого ядра, = 10812,3 МБ / с.
Итак, теперь я хочу вычислить фактический mflop / s / core, когда ядро имеет реальную пропускную способность памяти (4371 МБ / с).
Как вы думаете, было бы правильно, если бы я вычислил это так:
фактическая mflop/s/core= (mflop/s/core * фактическая память bw) / используемая пропускная способность памяти
Любая помощь будет оценена.