Должен ли я использовать FMA явно в C++AMP для ядер GPU?
Например, у меня есть выражение как a = b * c + d * e + f * g + h * i + j
, Должен ли я вместо этого написать a = fma(a, c, fma(d, e, fma(f, g, fma(h, i, j))))
?
Будет ли компилятор автоматически оптимизировать выражение? Или форма FMA на самом деле лучше, чем простая форма?
Мне было трудно узнать, из чего скомпилировано ядро в C++AMP... Должен ли я просто переключиться на OpenCL?