Как показать заголовок для профиля nsys?
Я заметил, что когда я использую nsys на своей машине
nsys profile --stats=true -o output-report ./input
Выводит такие данные:
NVIDIA Nsight Systems version 2022.4.2.50-32196742v0
[5/8] Executing 'cudaapisum' stats report
Time (%) Total Time (ns) Num Calls Avg (ns) Med (ns) Min (ns) Max (ns) StdDev (ns) Name
-------- --------------- --------- ------------ ------------ ---------- ----------- ------------ ----------------------
46.7 100,404,793 3 33,468,264.3 22,463.0 12,434 100,369,896 57,938,512.8 cudaMallocManaged
39.5 84,938,847 1 84,938,847.0 84,938,847.0 84,938,847 84,938,847 0.0 cudaDeviceSynchronize
13.8 29,677,781 3 9,892,593.7 9,610,457.0 9,514,092 10,553,232 574,154.9 cudaFree
0.0 82,478 1 82,478.0 82,478.0 82,478 82,478 0.0 cuLibraryLoadData
0.0 40,588 1 40,588.0 40,588.0 40,588 40,588 0.0 cudaLaunchKernel
0.0 892 1 892.0 892.0 892 892 0.0 cuModuleGetLoadingMode
Раздел описывается как «Выполнение отчета о статистике cudaapisum» вместо обычного заголовка, такого как «Статистика API CUDA». Поэтому мне интересно, есть ли флаг, который я могу использовать для вывода статистики, как показано ниже:
Вывод ниже не с моей машины, а с машины AWS.
NVIDIA Nsight Systems version 2021.1.1.66-6c5c5cb
CUDA API Statistics:
Time(%) Total Time (ns) Num Calls Average Minimum Maximum Name
------- --------------- --------- ----------- --------- --------- ---------------------
61.5 250696605 3 83565535.0 36197 250541972 cudaMallocManaged
32.8 133916228 1 133916228.0 133916228 133916228 cudaDeviceSynchronize
5.7 23226526 3 7742175.3 6373371 9064987 cudaFree
0.0 56395 1 56395.0 56395 56395 cudaLaunchKernel
И еще одна вещь, которую я должен упомянуть, это то, что на моей машине он автоматически выводит файл профиля с расширением .nsys-rep, а не с расширением .qdrep. Они оба одинаковые или разные?
Я пытался найти информацию в документации nsys , но ничего не нашел. Я пробовал искать в stackoverflow и на форуме nvidia на Nsight, но пока ничего не нашел. Может быть, я что-то пропустил. Любая помощь будет оценена.
Примечание: оба они используют одну и ту же команду, но немного другой файл.
1 ответ
И еще одна вещь, которую я должен упомянуть, это то, что на моей машине он автоматически выводит файл профиля с расширением .nsys-rep, а не с расширением .qdrep. Они оба одинаковые или разные?
.nsys-rep
это новое имя расширения для.qdrep
файлы, это тот же формат, хотя. Изменение произошло с версией 2021.4.
В частности, из примечаний к выпуску вышеупомянутой версии:
Переименование файла результата
Чтобы сделать семейство инструментов Nsight более согласованным, все версии Nsight Systems, начиная с 2021.4, по умолчанию будут использовать расширение «.nsys-rep» для создаваемых файлов отчетов.
В более старых версиях Nsight Systems использовалось расширение «.qdrep».
Графический интерфейс пользователя Nsight Systems 2021.4 и более поздние версии по-прежнему будут поддерживать открытие старых отчетов «.qprep».
Версии графического интерфейса Nsight Systems старше 2021.4 не смогут открывать отчеты «.nsys-rep».
Обратите внимание, что версии инструмента на вашем локальном компьютере и на компьютере AWS различаются.
Поэтому мне интересно, есть ли флаг, который я могу использовать для вывода статистики, как показано ниже.
Нет флага для управления выходом, который вы упоминаете. Вы можете немного изменить свой рабочий процесс, профилировать свое приложение без--stats
Переключатель CLI и соберите файл отчета (nsys-rep
/qdrep
). Затем вы можете использовать команду nsys stats и применить определенные статистические отчеты к вашему файлу отчета.
Если у вас есть пожелания к инструменту Nsight Systems, сообщите нам об этом через форум разработчиков NVIDIA .