V_SUB_F64 в наборе инструкций AMD GCN и VEGA

Почему в наборе инструкций AMD GCN и VEGA нет инструкции "V_SUB_F64"? Как они реализуют вычитание двойной точности?

Как показано на рисунке

1 ответ

В разделе 6.2.1 "Входы инструкций" документа "Архитектура набора инструкций" говорится:

Инструкции с использованием формы VOP3, а также с использованием входов с плавающей запятой имеют опцию применения абсолютного значения (поле ABS) или отрицания (поле NEG) к любому из входных операндов.

V_ADD_F64 указана как инструкция, закодированная в VOP3, поэтому вы можете отменить один или оба операнда для получения (a + b), (a - b), (-a + b), или же (-a - b),

Другие вопросы по тегам