Описание тега cuda-profiling

2 ответа

Могу ли я перейти к профилированию конкретного вызова определенного ядра?

Я использую графический интерфейс NSight Compute (ncu-ui) для профилирования ядер в определенном приложении. Мое приложение вызывает ядро my_kernel_1тысячи раз, затем вызывает тысячи раз. Я не хочу профилировать все вызовы всех ядер; Я просто хочу п…
0 ответов

Профилирование поведения блоков ядра CUDA

Профилирую ядро, работа которого в разных блоках неравномерна: Различные блоки могут считывать или записывать разное количество данных. Некоторые блоки могут считывать в основном кэшированные данные, а другие нет. Некоторые блоки могут применять бол…
22 май '22 в 15:10
0 ответов

Что происходит с функциями именования NVTX wchar_t?

Библиотека NVIDIA «Toolkit Extensions SDK», NVTX, занимается профилированием. В частности, у него есть методы: nvtxNameOsThreadA() для именования потока США с использованием const char*а также const wchar_t*соответственно. ... кроме документации (дл…
27 май '22 в 22:03
2 ответа

Как получить среднее время выполнения ядра CUDA с помощью NSight Systems или NSight Compute

Предположим, у меня есть простое тестовое приложение CLI с именем «Foo». Это приложение выполняет ядро ​​«Bar» 100 раз в цикле. Как я могу получить среднее время выполнения ядра для Bar, используя Nsight Systems или Nsight Compute, версии этих прило…
23 мар '23 в 09:29