Самый быстрый метод расчета свертки

Question

Самый быстрый метод расчета свертки

Кто-нибудь знает о самом быстром способе вычисления свертки? К сожалению, матрица, с которой я имею дело, очень большая (500x500x200), и если я использую convn в MATLAB это занимает много времени (мне приходится повторять этот расчет во вложенном цикле). Итак, я использовал свертку с FFT и теперь она быстрее. Но я все еще ищу более быстрый метод. Любая идея?

10

c++ matlab signal-processing convolution template-matching

Источник

user1075927 12 дек '13 в 21:30

3 ответа

Решение

Вы можете попробовать методы overlap-add и overlap-save. Они включают в себя разбиение входного сигнала на более мелкие куски, а затем с помощью любого из вышеуказанных методов.

FFT наиболее вероятен - и я могу ошибаться - самый быстрый метод, особенно если вы используете встроенные подпрограммы в MATLAB или библиотеку в C++. Кроме того, неплохо было бы разбить входной сигнал на более мелкие куски.

2

Источник

user350685 12 дек '13 в 21:34

У меня есть 2 способа рассчитать fastconv

и 2 лучше, чем 1

1 - броненосец, вы можете использовать библиотеку броненосца для вычисления конв с этим кодом

cx_vec signal(1024,fill::randn);
cx_vec code(300,fill::randn);
cx_vec ans = conv(signal,code);

2- используйте fftw ans sigpack и библиотеку armadillo для вызова fast conv таким образом, вы должны инициализировать fft вашего кода в конструкторе

FastConvolution::FastConvolution(cx_vec inpCode)
{
    filterCode = inpCode;
    fft_w = NULL;
}


cx_vec FastConvolution::filter(cx_vec inpData)
{
int length = inpData.size()+filterCode.size();
    if((length & (length - 1)) == 0)
    {

    }
    else
    {
        length = pow(2 , (int)log2(length) + 1);
    }
    if(length != fftCode.size())
        initCode(length);

    static cx_vec zeroPadedData;
    if(length!= zeroPadedData.size())
    {
        zeroPadedData.resize(length);
    }
    zeroPadedData.fill(0);
    zeroPadedData.subvec(0,inpData.size()-1) = inpData;


    cx_vec fftSignal = fft_w->fft_cx(zeroPadedData);
    cx_vec mullAns = fftSignal % fftCode;
    cx_vec ans = fft_w->ifft_cx(mullAns);
    return ans.subvec(filterCode.size(),inpData.size()+filterCode.size()-1);
}

void FastConvolution::initCode(int length)
{
    if(fft_w != NULL)
    {
        delete fft_w;
    }
    fft_w = new sp::FFTW(length,FFTW_ESTIMATE);
    cx_vec conjCode(length,fill::zeros);
    fftCode.resize(length);
    for(int i = 0; i < filterCode.size();i++)
    {
        conjCode.at(i) = filterCode.at(filterCode.size() - i - 1);
    }
    conjCode = conj(conjCode);
    fftCode = fft_w->fft_cx(conjCode);
}

1

Источник

user4879953 18 окт '17 в 06:38

Другие вопросы по тегам c++ matlab signal-processing convolution template-matching

user2778484 12 дек '13 в 23:01 2013-12-12 23:01 · Accepted Answer · 2013-12-12 23:01

Если ваше ядро отделимо, наибольшее увеличение скорости будет реализовано при выполнении нескольких последовательных одномерных сверток.

Стив Эддинс из MathWorks в своем блоге описывает, как воспользоваться преимуществами ассоциативности свертки для ускорения свертки, когда ядро отделимо в контексте MATLAB. Для P-by-Q ядро, вычислительное преимущество выполнения двух отдельных и последовательных сверток по сравнению с двумерной сверткой PQ/(P+Q), что соответствует 4.5x для ядра 9x9 и ~11x для ядра 15x15. РЕДАКТИРОВАТЬ: интересная невольная демонстрация этого различия была дана в этом Q & A.

Чтобы выяснить, является ли ядро отделимым (т. Е. Внешним произведением двух векторов), в блоге рассказывается, как проверить, разделяемо ли ваше ядро с помощью SVD и как получить 1D-ядра. Их пример для двумерного ядра. Для решения для N-мерной отделимой свертки, проверьте это представление FEX.

Еще один ресурс, на который стоит обратить внимание, - это реализация 3D свертки SIMD (SSE3/SSE4) от Intel, которая включает в себя как источник, так и презентацию. Код для 16-битных целых чисел. Если вы не перейдете на GPU (например, cuFFT), вероятно, будет трудно получить скорость быстрее, чем реализации Intel, которые также включают Intel MKL. Внизу этой страницы документации MKL приведен пример трехмерной свертки (с плавающей точкой одинарной точности) (ссылка исправлена, теперь она отражена в /questions/46914901/3d-convolution-s-ispolzovaniem-intel-mkl/46914921#46914921).