Описание тега cuda-profiling
2
ответа
Могу ли я перейти к профилированию конкретного вызова определенного ядра?
Я использую графический интерфейс NSight Compute (ncu-ui) для профилирования ядер в определенном приложении. Мое приложение вызывает ядро my_kernel_1тысячи раз, затем вызывает тысячи раз. Я не хочу профилировать все вызовы всех ядер; Я просто хочу п…
15 май '22 в 14:28
0
ответов
Профилирование поведения блоков ядра CUDA
Профилирую ядро, работа которого в разных блоках неравномерна: Различные блоки могут считывать или записывать разное количество данных. Некоторые блоки могут считывать в основном кэшированные данные, а другие нет. Некоторые блоки могут применять бол…
22 май '22 в 15:10
0
ответов
Что происходит с функциями именования NVTX wchar_t?
Библиотека NVIDIA «Toolkit Extensions SDK», NVTX, занимается профилированием. В частности, у него есть методы: nvtxNameOsThreadA() для именования потока США с использованием const char*а также const wchar_t*соответственно. ... кроме документации (дл…
27 май '22 в 22:03
2
ответа
Как получить среднее время выполнения ядра CUDA с помощью NSight Systems или NSight Compute
Предположим, у меня есть простое тестовое приложение CLI с именем «Foo». Это приложение выполняет ядро «Bar» 100 раз в цикле. Как я могу получить среднее время выполнения ядра для Bar, используя Nsight Systems или Nsight Compute, версии этих прило…
23 мар '23 в 09:29