NEON имеет такую ​​же производительность, как C на IMX7

Привет, я разрабатываю приложение для обработки изображений на Nxp imx7, и я хочу сравнить производительность инструментов NEON с чистым C.

c: a,b, c - float32. Бег занимает 11 мс

for(int pixIndex = 0; pixIndex<(640*480); pixIndex++)
{
    a[pixIndex] = (a[pixIndex] * b[pixIndex]) + c[pixIndex];
}

НЕОН: запуск занимает 10 мс

for(int pixIndex = 0; pixIndex < (640*480)/2; pixIndex++)
{
    float32x2_t dVect1, dVect2,dVect3;

    dVect1 = vld1_f32(a);
    dVect2 = vld1_f32(b);
    dVect3 = vld1_f32(c);
    dVect1 = vmla_f32(dVect3, dVect1, dVect2);
    vst1_f32(a, dVect1);
    a += 2;
    b += 2;
    c += 2;
}

Почему NEON всего на 1 мс быстрее, чем c? Я что-то здесь упускаю?

0 ответов

Другие вопросы по тегам