Где хранится промежуточный результат инструкции SIMD?
В Intel Intrinsics вы можете найти такие инструкции:
В описании: "Умножьте упакованные 64-битные целые числа в a и b, получив промежуточные 128-битные целые числа, и сохраните младшие 64 бита промежуточных целых чисел в dst.", Говорится, что инструкция выдаст полные 128-битные целое число в качестве промежуточного результата, но оно сохранит только младшие 64 бита.
Как мне получить высокие 64 бита?
Аналогичная инструкция есть mulx
, он умножает два 64-битных целых числа и сохраняет все 128 бит в два 64-битных регистра. На самом деле я просто хочу найти SIMD-версиюmulx
.