Модель Roofline: как увеличение арифметической интенсивности позволяет улучшить производительность?

Совет от Intel: если вы не можете сломать крышу памяти, попробуйте переработать свой алгоритм для более интенсивной арифметической обработки. Это сдвинет вас вправо и даст вам больше возможностей для повышения производительности, прежде чем вы достигнете предела пропускной способности памяти.

Для алгоритмов в области, связанной с памятью, на графике линии крыши Intel предлагает увеличить интенсивность арифметических вычислений, чтобы они перемещались вправо (область, связанная с вычислениями), что дает возможность улучшить производительность, поскольку крыша производительности будет выше.

Я не могу понять, как увеличение арифметической интенсивности (скажем, увеличение количества операций в алгоритме) может улучшить такой показатель производительности, как время, необходимое для работы алгоритма. Разве вам не нужно делать больше, нет. вычислений даже для более высокой производительности (в FLOPS)? Может кто-нибудь объяснить, как это возможно?

0 ответов

Другие вопросы по тегам