NoneCuFFT is a FFT library for CUDA enabled GPUs. Capabilities are similar to the FFTW library.
1 ответ

CuFFT пакетный против одного преобразования

Документация NVIDIA cuda для cuFFT гласит: "Эти пакетные преобразования имеют более высокую производительность, чем отдельные преобразования" (подробнее на: http://docs.nvidia.com/cuda/cufft/index.html Следуйте за нами: @GPUComputing on Twitter | NV…
21 фев '18 в 01:32
1 ответ

Почему cuda-memcheck racecheck сообщает об ошибках с помощью cufft?

Инструмент racecheck сообщил о скачках памяти с моим приложением. Я выделил его для exec-функций CUFFT. Я делаю что-то неправильно? Если нет, то как я могу заставить гонку игнорировать это? Вот минимальный пример того, что при запуске в cuda-memchec…
05 окт '16 в 11:46
1 ответ

CUFFT | не могу понять простой пример

Я боролся весь день, пытаясь заставить базовый пример CUFFT работать должным образом. Однако я сталкиваюсь с небольшой проблемой, которую не могу определить. В основном у меня есть линейный 2D массив vx с координатами x и y. Затем я просто вычисляю …
05 окт '13 в 16:10
1 ответ

CUFFT: Как рассчитать FFT, когда входной сигнал представляет собой тональный массив

Я пытаюсь найти FFT динамически распределенного массива. Входной массив копируется с хоста на устройство с помощью cudaMemcpy2D, Затем берется fft (cufftExecR2C) и результаты копируются обратно с устройства на хост. Поэтому моя первоначальная пробле…
30 дек '13 в 20:29
1 ответ

Как выполнить cufft fwd и inv transform для определенной области интереса (ROI) в большем массиве?

Рассмотрим изображение размером 1920х1080. Как сделать манжету R2C и C2R для ROI 720х960?
11 фев '18 в 16:27
2 ответа

Вопрос профилирования cuFFT

Я пытаюсь получить данные профилирования для вызовов библиотеки cuFFT, например, plan и exec. Я использую nvprof (инструмент для профилирования командной строки), с опцией "--print-api-trace". Он печатает время для всех API, кроме API CuFFT. Есть ли…
15 апр '13 в 03:31
2 ответа

Обработка ошибок CUFFT

Я использую следующий макрос для обработки ошибок CUFFT: #define cufftSafeCall(err) __cufftSafeCall(err, __FILE__, __LINE__) inline void __cufftSafeCall(cufftResult err, const char *file, const int line) { if( CUFFT_SUCCESS != err) { fprintf(stderr,…
28 апр '13 в 19:53
1 ответ

CUFFT: попытка реализовать построчное fft матрицы

Я пытаюсь повторить функциональность Matlab FFT, где он делает строку за строкой (или столбец за столбцом) FFT матрицы. Каждый ряд будет одной из партий в плане манжеты. Я могу заставить его работать, используя cufftExecC2C (закомментированная часть…
09 июл '14 в 00:12
2 ответа

Параметры для use_device() openACC

Разрешено ли передавать объекты вместо указателя на следующую директиву прагма в соответствии с host_data use_device(myobject) здесь код, Pn - объект, а Pn.P - указатель на массив, в котором хранятся данные #pragma acc data pcopyin( rank,N ) { #prag…
22 фев '18 в 20:34
1 ответ

2D трансформация манжеты

Мой первый вопрос по stackru. Я новичок в Cuda.Я просто хочу выполнить 2D-комплексное БПФ.Мои входные данные обрабатываются, и заполнение не требуется.Я просто не могу получить ожидаемый результат. Вот мой код: #include <stdio.h> #include <…
08 июл '15 в 16:01
1 ответ

Применение cuFFT к объектам буфера вершин OpenGL

Итак cufftComplex тип представляет собой массив с n строит с x и y-поле, соответственно представляющее действительную и мнимую части каждого комплексного числа. С другой стороны, если я хочу создать буферный объект вершины в OpenGL с x- а также y- п…
13 фев '16 в 20:50
1 ответ

cufftSetStream вызывает вывод мусора. Я делаю что-то неправильно?

Согласно документам, cufftSetStream() функция Связывает поток CUDA с планом cuFFT. Все запуски ядра, сделанные во время выполнения плана, теперь выполняются через связанный поток [... пока...] поток изменяется с другим вызовом cufftSetStream(). К со…
19 авг '16 в 04:07
1 ответ

Повторное использование плана CUDA FFT в нескольких "перекрывающихся" запусках CUDA Stream

Я пытаюсь улучшить производительность моего кода с помощью асинхронной передачи памяти, перекрытой вычислениями на GPU. Раньше у меня был код, в котором я создал план FFT, а затем использовал его несколько раз. В такой ситуации время, потраченное на…
04 мар '15 в 13:33
0 ответов

Cuftt медленнее, чем FFT

Я "преобразовал" программу, которая использует fftw для cufft, хотя, используя GPU, производительность ниже, чем на CPU. Nvidia Visual Profiler предупреждает меня, что операции memcpy очень медленные, низкий параллелизм ядра и копии не полностью исп…
24 фев '19 в 04:01
1 ответ

CUDA FFT не возвращает ожидаемые значения

В настоящее время я отлаживаю свой код, где я использую подпрограммы CUDA FFT. У меня есть что-то вроде этого (см. Комментарии для моих мыслей о том, что я делаю): #include <cufft.h> #include <cuda.h> #include <cuda_runtime.h> #inc…
14 апр '16 в 08:12
1 ответ

Преобразование массива NumPy в cufftComplex

Я пишу сценарий для выполнения FFT с использованием библиотеки cuFFT на основе GPU/CUDA. CuFFT требует, чтобы входные данные были в формате, указанном как "cufftComplex". Однако мои входные данные в формате numpy.complex64. Я использую C-API Python …
22 май '18 в 21:57
0 ответов

Соответствие шаблона с использованием cufft в CUDA?

Вот мой код, реализующий задачу сопоставления шаблона с использованием FFT, предоставленного в cufft. Логика ядра аналогична коду Matlab, представленному здесь: Код Matlab: clear all; close all; template = rgb2gray(imread('possum_ear.jpg')); backgro…
12 июл '18 в 05:04
1 ответ

cuFFT не может восстановиться после ошибки

Я не могу найти способ начать обработку cuFFT после предыдущего неудачного запуска. Вот минимальный пример. Основная идея заключается в следующем: мы создаем простой процессор cuFTT, который может управлять его ресурсами (памятью устройства и планам…
23 авг '16 в 11:29
1 ответ

Не одно и то же изображение после cuda FFT и iFFT

Я пытаюсь предварительно сформировать FFT -> линейная фильтрация -> iFFT на 2D-изображении с помощью CUDA. Во-первых, в качестве теста я попытался сделать FFT и iFFt без каких-либо фильтров. После БПФ и iFFT изображение выглядит одинаково, но до опе…
30 июл '14 в 10:33
1 ответ

Как я могу получить полные коэффициенты БПФ по cufft?

Я делаю двумерный процесс FFT с помощью cufft. Тип обработки от реального к сложному, поэтому размер массива out равен NX * (NY / 2 + 1), что не является избыточным. Но мне нужны полные коэффициенты, содержащие избыточные. Как я могу получить их все…
11 ноя '14 в 08:02