CuFFT пакетный против одного преобразования

Документация NVIDIA cuda для cuFFT гласит: "Эти пакетные преобразования имеют более высокую производительность, чем отдельные преобразования" (подробнее на: http://docs.nvidia.com/cuda/cufft/index.html Следуйте за нами: @GPUComputing on Twitter | NVIDIA в фейсбуке) Но не показывает ничего количественного. какая-нибудь информация о том, насколько будет ускорение? из одного преобразования я имею в виду внутри цикла.

1 ответ

Ускорение будет зависеть от размера матриц, количества пакетов и целевого оборудования (также версии CUDA Toolkit). Если у вас есть большая партия маленьких матриц, вы увидите ускорение, чем в противном случае. Частью ускорения является избежание накладных расходов на запуск, поэтому для размеров матрицы, которые достаточно велики, чтобы издержки на запуск были небольшими по сравнению с выполнением ядра, вы не увидите такого ускорения. Я считаю, что для очень маленьких матриц они могут упаковать несколько пакетов вместе и использовать более эффективные функции памяти.

Я спрашиваю вокруг, чтобы увидеть, есть ли какие-либо официальные документы или другие опубликованные отчеты. До сих пор я не нашел ни одного.

Другие вопросы по тегам