Как показать заголовок для профиля nsys?

Я заметил, что когда я использую nsys на своей машине

      nsys profile --stats=true -o output-report ./input

Выводит такие данные:

      NVIDIA Nsight Systems version 2022.4.2.50-32196742v0


[5/8] Executing 'cudaapisum' stats report

Time (%)  Total Time (ns)  Num Calls    Avg (ns)      Med (ns)     Min (ns)    Max (ns)    StdDev (ns)            Name         
 --------  ---------------  ---------  ------------  ------------  ----------  -----------  ------------  ----------------------
     46.7      100,404,793          3  33,468,264.3      22,463.0      12,434  100,369,896  57,938,512.8  cudaMallocManaged     
     39.5       84,938,847          1  84,938,847.0  84,938,847.0  84,938,847   84,938,847           0.0  cudaDeviceSynchronize 
     13.8       29,677,781          3   9,892,593.7   9,610,457.0   9,514,092   10,553,232     574,154.9  cudaFree              
      0.0           82,478          1      82,478.0      82,478.0      82,478       82,478           0.0  cuLibraryLoadData     
      0.0           40,588          1      40,588.0      40,588.0      40,588       40,588           0.0  cudaLaunchKernel      
      0.0              892          1         892.0         892.0         892          892           0.0  cuModuleGetLoadingMode

Раздел описывается как «Выполнение отчета о статистике cudaapisum» вместо обычного заголовка, такого как «Статистика API CUDA». Поэтому мне интересно, есть ли флаг, который я могу использовать для вывода статистики, как показано ниже:

Вывод ниже не с моей машины, а с машины AWS.

      NVIDIA Nsight Systems version 2021.1.1.66-6c5c5cb


CUDA API Statistics:

 Time(%)  Total Time (ns)  Num Calls    Average     Minimum    Maximum           Name         
 -------  ---------------  ---------  -----------  ---------  ---------  ---------------------
    61.5        250696605          3   83565535.0      36197  250541972  cudaMallocManaged    
    32.8        133916228          1  133916228.0  133916228  133916228  cudaDeviceSynchronize
     5.7         23226526          3    7742175.3    6373371    9064987  cudaFree             
     0.0            56395          1      56395.0      56395      56395  cudaLaunchKernel     

И еще одна вещь, которую я должен упомянуть, это то, что на моей машине он автоматически выводит файл профиля с расширением .nsys-rep, а не с расширением .qdrep. Они оба одинаковые или разные?

Я пытался найти информацию в документации nsys , но ничего не нашел. Я пробовал искать в stackoverflow и на форуме nvidia на Nsight, но пока ничего не нашел. Может быть, я что-то пропустил. Любая помощь будет оценена.

Примечание: оба они используют одну и ту же команду, но немного другой файл.

1 ответ

И еще одна вещь, которую я должен упомянуть, это то, что на моей машине он автоматически выводит файл профиля с расширением .nsys-rep, а не с расширением .qdrep. Они оба одинаковые или разные?

.nsys-repэто новое имя расширения для.qdrepфайлы, это тот же формат, хотя. Изменение произошло с версией 2021.4.

В частности, из примечаний к выпуску вышеупомянутой версии:

Переименование файла результата

  • Чтобы сделать семейство инструментов Nsight более согласованным, все версии Nsight Systems, начиная с 2021.4, по умолчанию будут использовать расширение «.nsys-rep» для создаваемых файлов отчетов.

  • В более старых версиях Nsight Systems использовалось расширение «.qdrep».

  • Графический интерфейс пользователя Nsight Systems 2021.4 и более поздние версии по-прежнему будут поддерживать открытие старых отчетов «.qprep».

  • Версии графического интерфейса Nsight Systems старше 2021.4 не смогут открывать отчеты «.nsys-rep».

Обратите внимание, что версии инструмента на вашем локальном компьютере и на компьютере AWS различаются.

Поэтому мне интересно, есть ли флаг, который я могу использовать для вывода статистики, как показано ниже.

Нет флага для управления выходом, который вы упоминаете. Вы можете немного изменить свой рабочий процесс, профилировать свое приложение без--statsПереключатель CLI и соберите файл отчета (nsys-rep/qdrep). Затем вы можете использовать команду nsys stats и применить определенные статистические отчеты к вашему файлу отчета.

Если у вас есть пожелания к инструменту Nsight Systems, сообщите нам об этом через форум разработчиков NVIDIA .

Другие вопросы по тегам