ARM Neon: VPADAL для вычитания

Я использую VPADAL.U32 инструкция, чтобы значительно увеличить мою скорость кода дополнения. Однако мне нужно что-то вычесть с накоплением и переносом (именно то, что я получил как дополнение).

Желаемое за действительное или реально возможное?

Из того, что я мог собрать, мне нужно уменьшить мой второй операнд, а не его биты... VPADALи затем битовый тест на 1 и вычтите 1 из полученного переноса (чтобы получить 0 или -1 - мое накопление).

Я где-то скучаю по тайной технике?

1 ответ

Решение

Вы можете использовать VPADDL для попарного суммирования добавлений и удвоения ширины, а затем использовать VQSUB, чтобы вычесть этот термин из общей суммы.

Другие вопросы по тегам