Вопрос профилирования cuFFT
Я пытаюсь получить данные профилирования для вызовов библиотеки cuFFT, например, plan и exec. Я использую nvprof (инструмент для профилирования командной строки), с опцией "--print-api-trace". Он печатает время для всех API, кроме API CuFFT. Есть ли какой-либо флаг, который мне нужно изменить, чтобы получить данные профилирования cuFFT? Или мне нужно использовать события и измерить себя??
2 ответа
Согласно документации nvprof, api-trace-mode:
Режим API-трассировки показывает временную шкалу всех вызовов API CUDA во время выполнения и драйвера
cuFFT не является ни API времени выполнения CUDA, ни API драйвера CUDA. Это библиотека подпрограмм для FFT, чья документация находится здесь.
Вы по-прежнему можете использовать nvprof, профилировщик командной строки или визуальный профилировщик, чтобы, конечно, собирать данные о том, как cuFFT использует графический процессор.
Получил это работает.. Вместо использования nvprof я использовал переменную окружения CUDA_PROFILE.