Где хранится промежуточный результат инструкции SIMD?

В Intel Intrinsics вы можете найти такие инструкции:

_mm256_mullo_epi64

В описании: "Умножьте упакованные 64-битные целые числа в a и b, получив промежуточные 128-битные целые числа, и сохраните младшие 64 бита промежуточных целых чисел в dst.", Говорится, что инструкция выдаст полные 128-битные целое число в качестве промежуточного результата, но оно сохранит только младшие 64 бита.

Как мне получить высокие 64 бита?

Аналогичная инструкция есть mulx, он умножает два 64-битных целых числа и сохраняет все 128 бит в два 64-битных регистра. На самом деле я просто хочу найти SIMD-версиюmulx.

0 ответов

Другие вопросы по тегам