ARM Neon: VPADAL для вычитания
Я использую VPADAL.U32
инструкция, чтобы значительно увеличить мою скорость кода дополнения. Однако мне нужно что-то вычесть с накоплением и переносом (именно то, что я получил как дополнение).
Желаемое за действительное или реально возможное?
Из того, что я мог собрать, мне нужно уменьшить мой второй операнд, а не его биты... VPADAL
и затем битовый тест на 1 и вычтите 1 из полученного переноса (чтобы получить 0 или -1 - мое накопление).
Я где-то скучаю по тайной технике?
1 ответ
Решение
Вы можете использовать VPADDL для попарного суммирования добавлений и удвоения ширины, а затем использовать VQSUB, чтобы вычесть этот термин из общей суммы.