Описание тега nvvp
NVVP (NVIDIA Visual Profiler) - это название проприетарного инструмента профилирования CUDA для графического процессора с графическим интерфейсом NVIDIA.
1
ответ
Ядра CUDA не перекрываются
У меня есть простое ядро векторного умножения, которое я выполняю для 2 потоков. Но когда я создаю профиль в NVVP, кажется, что ядра не перекрываются. Это потому, что каждое ядро использует%100 графического процессора, если нет, что может быть п…
04 фев '16 в 20:02
1
ответ
Как связать события, метрики и результаты на уровне источника для профилирования программы pyCUDA с использованием nvvp
Когда я пытаюсь профилировать свое приложение pyCUDA с помощью nvvp, оно работает по большей части. Я могу нажать "Проверить использование графического процессора" и просмотреть ряд результатов анализа / предложений для моего кода, например "Низкая …
07 дек '15 в 15:13
2
ответа
Чрезмерная нагрузка на профилировщик с NVidia Visual Profiler
Я получаю много профилирования при попытке профилировать мой код с помощью nvvp (или с nvprof): Общее время составляет 98 мс, и я получаю 85 мс "Instrumentation" при первом запуске ядра. Как я могу уменьшить эту нагрузку на профилирование или увелич…
23 окт '17 в 23:53
1
ответ
Cuda profiler показывает странные промежутки?
Я пытаюсь выяснить, что означает результат профиля, прежде чем приступить к оптимизации. Я очень новичок в CUDA и профилировании в целом, и я смущен результатом. В частности, я хочу знать, что происходит во время, казалось бы, незанятых кусков вычис…
12 дек '12 в 12:03
0
ответов
Есть ли способ запустить nvvp в системе, отличной от nvidia?
У меня есть сервер Linux с установленной видеокартой NVIDIA. К серверу у меня есть доступ только из командной строки (нет доступа к рабочему столу). Я делаю все свои программы Cuda на удаленном сервере Linux. Теперь я хочу запустить NVVP на моем лок…
02 мар '19 в 14:54
1
ответ
Параметры анализа зависимостей в CUDA Profiler
Я реализовал программу, которая использует один графический процессор, используя cudaStreamWaitEvent() функция для установки зависимости в двух потоках с использованием событий. Чтобы проверить эту зависимость, возможно ли использовать представление…
11 июл '17 в 11:18
1
ответ
Профилирование приложения OpenCL в Windows с графическим процессором NVIDIA
Вы не могли бы мне помочь? Я занимаюсь разработкой приложения OpenCL на Windows 7 x64. Аппаратное обеспечение - Intel Core i5, NVIDIA GTX 770. OpenCL использует NVIDIA для ускорения. Если я пытаюсь использовать Intel VTune Amplifier XE 2015, мое при…
10 авг '16 в 11:40
1
ответ
nvprof, чтобы открыть формат трассировки или slog2
Я хочу сгенерировать трассировку моей программы cuda и просмотреть ее. поэтому я запускаю его с помощью следующей команды nvprof --print-gpu-trace ./my_exec Который печатает трассировку в текстовом формате, который имеет свои ограничения для пониман…
01 янв '14 в 20:08
2
ответа
Как наблюдать за событиями и метриками CUDA для подраздела исполняемого файла (например, только во время выполнения ядра)?
Я знаком с использованием nvprof для доступа к событиям и метрикам бенчмарка, например, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname system-profiling on --print-gpu-trace -o (filename) Команда д…
17 сен '15 в 17:16
1
ответ
nsight EE и nvvp оба аварийно завершают работу при запуске в Ubuntu 16.10
Когда я запускаю оба приложения, они выходят из строя после появления заставки. Небольшое диалоговое окно появляется с сообщением an error has occurred. see the log file null (Я не знаю, где найти указанный нулевой файл). сообщение об ошибке консоли…
01 июн '17 в 21:39
0
ответов
nvprof показывает ошибку с TensorFlow
Я пытаюсь запустить nvprof с cifar10_multigpu_train.py, Я использую следующую команду /home/ibm/tensorflow/third_party/gpus/cuda/bin/nvprof python cifar10_multi_gpu_train.py Он запускает приложение, но через некоторое время показывает следующие ошиб…
27 фев '17 в 19:46
1
ответ
Экспорт вывода CUDA nvprof в визуальный профилировщик
Я хотел бы извлечь данные из моего приложения GPU, чтобы проверить его пределы. Я должен использовать nvprof, потому что приложение работает на удаленном сервере, поэтому я должен создать файл для локального импорта в Visual Profiler. Я пытался созд…
21 янв '16 в 21:15
2
ответа
Могу ли я профилировать ядро OpenACC на уровне исходного кода C?
Я пытаюсь ускорить мой код с помощью openacc с компилятором PGI 15.7. Я хочу профилировать мой код на уровне исходного кода C. Я использую профилировщик 'nvvp' из CUDA 7.0 Когда я запускаю nvvp, я могу использовать 'анализ-анализ' и определить, кака…
08 сен '15 в 09:31
1
ответ
Что означает "выданная инструкция" в отчете, представленном CUDA nvvp?
Я использую визуальный профилировщик Nvidia (nvvp) для выполнения профилирования ядра на ядре cublas. Эта ссылка Распределение задержек является результатом распределения задержек. В документе таким образом объясняется термин "инструкция выдана" - "…
19 апр '18 в 13:17
1
ответ
Как профилировать код CUDA на безголовом узле?
Я работаю над приложением CUDA, которое я хотел бы профилировать. До сих пор я использовал только профилировщик командной строки, nvprof, который просто отображает обобщенную статистику. Я думал об использовании профилировщика GUI, NVVP. Проблема в …
07 ноя '17 в 21:34
1
ответ
Почему операции в двух потоках CUDA не перекрываются?
Моя программа представляет собой конвейер, который содержит несколько ядер и memcpys. Каждая задача будет проходить через один и тот же конвейер с разными входными данными. Хост-код сначала выбирает канал, инкапсуляцию памяти блокнота и объекты CUDA…
15 янв '19 в 14:47
1
ответ
Профиль отладки или выпуска кода cuda?
Я профилировал приложение с nvprof and nvvp (5.5) для того, чтобы оптимизировать его. Тем не менее, я получаю совершенно разные результаты для некоторых показателей / событий, таких как inst_replay_overhead, ipc или же branch_efficiencyи т.д., когда…
13 янв '15 в 22:22
1
ответ
Как указать nvprof "устройства" для Nvidia Visual Profiler?
CUDA Toolkit 9.0, Windows 10, GTX 1060 и NVS 315, 385.54 версия драйвера. Nvidia Visual Profiler всегда не в состоянии профилировать, возвращая следующие два предупреждения: "Предупреждение: эта версия nvprof не поддерживает базовое устройство, проф…
17 апр '18 в 12:19
1
ответ
Как интерпретировать анализ / рекомендации NVIDIA Visual Profiler?
Я относительно новичок в CUDA и в настоящее время нахожусь в проекте по ускорению приложений компьютерного зрения во встроенных системах с подключенным gpu (NVIDIA TX1). Я пытаюсь выбрать между двумя библиотеками: OpenCV и VisionWorks(включая OpenVX…
02 май '17 в 13:48
1
ответ
В чем разница между копиями памяти DtoD и PtoP?
При профилировании приложения с помощью nvprof я нашел оба PtoP а также DtoD тетср. Я не уверен в разнице между этими двумя.
14 июл '17 в 02:33