Описание тега nvtx

1 ответ

Расширения инструментария NV включают расположение файлов - Linux против Windows

В Linux, если у вас есть /path/to/cuda-10.0/include в вашем пути включения вы можете #include <nvToolsExt.h>и жизнь хороша. Однако соавтор, использующий Windows, только что сказал мне, что (с CUDA 10) файлы, связанные с nvtx, находятся в подка…
08 ноя '18 в 09:23
1 ответ

Поиск библиотеки расширений nVIDIA Toolkit с помощью CMake

Я использую недавнюю версию CMake с внутренней поддержкой CUDA в качестве языка для создания проекта. Для этого проекта требуется библиотека расширений nVIDIA Toolkit. В предыдущей системе у меня это было под /usr/local/cuda/lib64, Я использовал fin…
15 июн '19 в 01:06
1 ответ

Отсутствует статическая библиотека расширений nVIDIA Toolkit для CUDA 10.0

Для проекта Linux я пытаюсь профилировать статическую библиотеку, которая использует вызовы библиотеки CUDA NPP. Я хотел бы использовать API-интерфейс NVTX для профилирования наших процедур, чтобы увидеть, какие из них более эффективны. Однако, несм…
02 авг '19 в 21:51
1 ответ

Как перенести tf.Session в вызов tf.train.MonitoredSession, разрешив модификации графа

Код, я работаю на это это.Код использует вызов tf.session для получения графа для задач обнаружения объектов. Ссылка Моя цель здесь - профилировать этот код для графических процессоров Nvidia с помощью nvtx-plugins-tf для анализа времени, затрачивае…
0 ответов

Могу ли я добавить свои маркеры NVTX в трассировку CUPTI Activity API?

Я запустил пример activity_trace_async в папке cuda/extras/CUPTI/samples и увидел, что вы можете включить CUPTI_ACTIVITY_KIND_MARKERдля отслеживания. Но когда я добавил несколько маркеров NVTX, например nvtxRangePushA("Pass0"); do_pass(0);…
30 окт '20 в 11:42
0 ответов

Была ли проделана какая-либо работа по обеспечению осведомленности OpenTelemetry GPU? [закрыто]

Фреймворки трассировки только для ЦП, такие как Jaeger (и остальная часть OpenTelemetry, насколько я могу судить), имеют ножное ружье, в котором вы можете создать Span вокруг кода, который порождает (или ожидает) код, выполняющийся асинхронно на гра…
29 июн '21 в 12:23
0 ответов

Установка субпакета CUDA nvtx, но CMake не может найти nvToolsExt

Я пытаюсь создать свой репозиторий в Windows с помощью средства запуска действий GitHub под управлением Windows 10. Я устанавливаю CUDA 11.5 с помощью этого сетевого установщика , указав следующие пакеты: nvcc_11.5 visual_studio_integration_11.5 cur…
08 ноя '21 в 01:15
1 ответ

CMake не распознает NVTX после установки сети CUDA на Win10

Посмотрите на этот результат выполнения действий GitHub на компьютере под управлением Windows 10: nvcc_11.7 visual_studio_integration_11.7 curand_dev_11.7 nvrtc_dev_11.7 nvtx_11.7 cudart_11.7 visual_studio_integration_11.7 nsight_nvtx_11.7 Downloadi…
0 ответов

Что происходит с функциями именования NVTX wchar_t?

Библиотека NVIDIA «Toolkit Extensions SDK», NVTX, занимается профилированием. В частности, у него есть методы: nvtxNameOsThreadA() для именования потока США с использованием const char*а также const wchar_t*соответственно. ... кроме документации (дл…
27 май '22 в 22:03
0 ответов

Как я могу аннотировать аннотацию NVTX для экспортированной модели ONNX?

Я экспортирую модель ML из PyTorch в модель ONNX с помощьюtorch.onnx.exportфункция. Когда я использую модель PyTorch, у нее есть аннотации NVTX для оптимизации, которые используются для системы Nsight. Но когда я сменил модель с PyTorch на ONNX, она…
26 сен '22 в 15:42
0 ответов

Как увидеть маркеры NVTX в системах Nvidia Nsight? С хостом и гостем, являющимся одной и той же машиной Windows

Я пытаюсь профилировать приложения CPU/GPU, используя пакет Nsight. В настоящее время пытаясь понять проблему заикания, я добавил диапазон вокруг шага моделирования (происходящего на ЦП): #include "3rd/nvToolsExt.h" int main() { // ... nvtxRangePush…
24 авг '22 в 15:19
0 ответов

Маркеры nvtx с многопроцессорной обработкой Python

Я пытаюсь использовать маркеры nvtx вместе с многопроцессорным пулом в Python, но когда только дочерний процесс вызывает аннотированную функцию, операция не отображается в отчете о профилировании. Есть ли способ обойти это, или это ограничение проце…
09 дек '22 в 21:21