FFT (gpuArray) на месте и с эффективным использованием памяти вызывает реальный ввод?
Для реального NxM gpuArray функция fft() в Matlab возвращает комплексный NxM gpuArray, который удваивает выделенную память. Это делает невозможным работу с gpuArrays, которые занимают почти максимальный объем оперативной памяти графического процессора.
Есть ли способ использовать вызов cufft() на месте (дополненный) R2C (сложный N/2+1 x M touput) из Matlab без написания собственного ядра CUDA или вызова mexcuda?