Должен ли я использовать FMA явно в C++AMP для ядер GPU?

Например, у меня есть выражение как a = b * c + d * e + f * g + h * i + j, Должен ли я вместо этого написать a = fma(a, c, fma(d, e, fma(f, g, fma(h, i, j))))?

Будет ли компилятор автоматически оптимизировать выражение? Или форма FMA на самом деле лучше, чем простая форма?

Мне было трудно узнать, из чего скомпилировано ядро ​​в C++AMP... Должен ли я просто переключиться на OpenCL?

0 ответов

Другие вопросы по тегам