Описание тега nsight-systems
По вопросам, связанным с использованием профилировщика NVIDIA Nsight Systems
1
ответ
Как мне узнать время выполнения моего ядра из вывода sqlite3 Nsight-систем?
Предположим, я использую NSight Systems для профилирования моей программы и создаю базу данных SQLite 3 следующим образом: nsys profile -o /path/to/db --export=sqlite /path/to/executable --arg1=val1 --arg2 Что именно мне теперь делать, чтобы узнать …
14 мар '21 в 18:18
0
ответов
Системы Nsight: проблема с удаленным профилированием приложения CUDA на хосте Windows для цели Linux
Я использую Windows 10, пытаюсь профилировать приложение CUDA на сервере Linux с графическими процессорами с помощью Nsight Systems. Однако я не могу подключиться к удаленному компьютеру с помощью любого параметра. Когда я выбираю метод аутентификац…
24 апр '21 в 04:40
0
ответов
Система nsight не возвращает ошибку страницы в объединенной памяти
Когда я использую систему Nsight для профилирования отказа страницы унифицированной памяти, я не нашел результатов в возвращенной сводке. Я использую команду nsys profile --stats=true --cuda-um-gpu-page-faults=true --cuda-um-cpu-page-faults=true ./m…
06 июл '21 в 03:02
0
ответов
Рассчитайте количество отказов страниц единой памяти на основе выходных данных системы Nsight.
Я получаю выходные данные системы Nsight для унифицированного профилирования отказов страниц памяти. Вот некоторые записи, которые я обнаружил, которые могут быть связаны с ошибкой страницы единой памяти. {"Type":120,"CudaUvmGpuPageFaultEvent":{"sta…
09 июл '21 в 07:45
1
ответ
Независимый запуск скрипта Python отчета Nsight Systems
Я изменил копию одного из сценариев отчетов Nsight Systems (gpukernsum) и теперь хочу запустить его самостоятельно. Итак, я пишу: ./gpukernsum.py report.sqlite Это не работает; Я получил: ERROR: Script 'gpukernsum.py' encountered an internal error. …
14 июн '22 в 14:22
0
ответов
Как я могу аннотировать аннотацию NVTX для экспортированной модели ONNX?
Я экспортирую модель ML из PyTorch в модель ONNX с помощьюtorch.onnx.exportфункция. Когда я использую модель PyTorch, у нее есть аннотации NVTX для оптимизации, которые используются для системы Nsight. Но когда я сменил модель с PyTorch на ONNX, она…
26 сен '22 в 15:42
0
ответов
Могут ли Nsight Systems использовать URL-адреса отладочной информации?
Итак, я на Arch Linux, и библиотеки из официальных репозиториев не поставляются с символами отладки. Чтобы обойти это в большинстве инструментов отладки, можно использоватьDEBUGINFOD_URLS=https://debuginfod.archlinux.orgкак переменная среды (наприме…
20 окт '22 в 10:11
0
ответов
Nsys не показывает вывод профилирования ядер CUDA
Моя система V100 со следующей информацией: | NVIDIA-SMI 450.80.02 Версия драйвера: 450.80.02 Версия CUDA: 11.6 | Версия систем NVIDIA Nsight 2021.5.2.53-28d0e6e sudo sh -c «echo 2 >/proc/sys/kernel/perf_event_paranoid» /bin/bash: /proc/sys/kernel…
01 окт '22 в 11:39
1
ответ
Как показать заголовок для профиля nsys?
Я заметил, что когда я использую nsys на своей машине nsys profile --stats=true -o output-report ./input Выводит такие данные: NVIDIA Nsight Systems version 2022.4.2.50-32196742v0 [5/8] Executing 'cudaapisum' stats report Time (%) Total Time (ns) Nu…
17 фев '23 в 13:34
0
ответов
Есть ли способ в NVIDIA Nsight Systems ограничить отображаемые потоки?
У меня есть проект с тысячами потоков, но я хочу использовать систему Nsight для профилирования кода CUDA. Однако загрузка отчета занимает некоторое время, что, я полагаю, связано с большим количеством информации о потоках, в дополнение ко всему виз…
30 ноя '22 в 20:16
1
ответ
Как использовать nsys в Google Colab
Я загрузил nsight-system, установил ее в Google Colab и прекрасно использую эту команду для nsys. Но когда выключил и включил снова, оно пропало. Как сохранить, чтобы при повторном включении мне больше не нужно было устанавливать. Я понятия не имею,…
28 июл '23 в 03:53
2
ответа
Как получить среднее время выполнения ядра CUDA с помощью NSight Systems или NSight Compute
Предположим, у меня есть простое тестовое приложение CLI с именем «Foo». Это приложение выполняет ядро «Bar» 100 раз в цикле. Как я могу получить среднее время выполнения ядра для Bar, используя Nsight Systems или Nsight Compute, версии этих прило…
23 мар '23 в 09:29
2
ответа
Руководство по профилированию Nsys CLI
Я только вхожу в мир разработки CUDA и пытаюсь профилировать свой код. Ожидается запуск инструмента для профилирования, но появляется следующая ошибка: ======== Warning: This version of nvprof doesn't support the underlying device, GPU profiling ski…
19 май '23 в 19:29
0
ответов
Почему TensorRT enqueueV2 занимает больше времени при использовании более изолированных потоков в C++?
ОС: Windows 10 CUDA: версия 11.5 ТензорРТ: 8.6.1.6 OpenCV: 4.8.0, созданный с использованием CUDA. Версия драйвера: Самый последний драйвер (545.84). В моем приложении будет транслироваться с нескольких камер. Каждая камера будет управляться одним …
06 ноя '23 в 08:01