Nsys не показывает вывод профилирования ядер CUDA
Моя система V100 со следующей информацией:
| NVIDIA-SMI 450.80.02 Версия драйвера: 450.80.02 Версия CUDA: 11.6 | Версия систем NVIDIA Nsight 2021.5.2.53-28d0e6e
sudo sh -c «echo 2 >/proc/sys/kernel/perf_event_paranoid» /bin/bash: /proc/sys/kernel/perf_event_paranoid: файловая система только для чтения
Обратите внимание, что perf_event_paranoid равен 3.
Выходные данные: создано: /home/build/Baseline.nsys-rep
Это мой префикс команды:
nsys profile --capture-range=cudaProfilerApi --trace-fork-before-exec true --force-overwrite true -s cpu --cudabacktrace=all --stats=true -t cuda,nvtx,osrt,cudnn,cublas -o Baseline -w true
Вот когда я проверяю статус nsys:
статус nsys -e
Счетчик временных меток поддерживается: Нет
Проверка среды отбора проб
Параноидальный уровень ядра Linux = -1: ОК
Дистрибутив Linux = Ubuntu
Версия ядра Linux = 5.0.0-1032-azure: ОК
Доступен системный вызов Linux perf_event_open: ОК
Доступно триггерное событие выборки: OK
Поддержка Intel(c) Last Branch Record: недоступна
Среда отбора проб: ОК
Это вывод средства просмотра Nsight: (без данных ядра)Вывод профиля
Это вид диагностики: