Экспорт вывода CUDA nvprof в визуальный профилировщик

Я хотел бы извлечь данные из моего приложения GPU, чтобы проверить его пределы. Я должен использовать nvprof, потому что приложение работает на удаленном сервере, поэтому я должен создать файл для локального импорта в Visual Profiler. Я пытался создать файл с nvprof -o file_name <app> <params> и с nvprof --analysis-metrics --output-profile file_name <app> <params> но когда я импортирую эти файлы в Visual Profiler, в разделе " Анализ " некоторые поля становятся пустыми: "недостаточно данных о глобальной загрузке памяти", "недостаточно данных о глобальной памяти", "недостаточно данных SM ядра"... . Как я могу сгенерировать файл (или больше), чтобы получить всю информацию для раздела "Анализ"? Я компилирую код cuda с помощью nvcc с флагами -lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v, Вот несколько примеров пустых полей: введите описание изображения здесь

1 ответ

Вы можете попытаться добавить сеанс вместо импорта файла prof в визуальный профилировщик. Я сталкиваюсь с подобной проблемой. я добавил добавление сеанса в соответствии с инструкциями здесь, и вы сможете увидеть всю информацию.

Другие вопросы по тегам