Что показывает NSight Compute по причине задержки, которая не «поддерживается»?
В Руководстве по профилированию CUDA перечислены различные причины выборочных остановок деформации, например, выделение, барьер, дроссельная заслонка LG и т. д. И профайлер NSight Compute показывает их распределение как часть результатов профилирования.
Дело в том, что некоторые причины зависаний перечислены как поддерживаемые только начиная с некоторых вычислительных возможностей, например «LG Throttle: 7.0+».
Мой вопрос: что происходит в устройствах с более ранними вычислительными возможностями, когда причиной остановки является эта «неподдерживаемая» причина? Или, другими словами, каков запасной вариант для каждой из перечисленных причин остановки?
В Ye Olde NVIDIA Visual Profiler у нас была «Другая» причина задержки, см.:
Каковы «другие» причины приостановки работы, отображаемые профилировщиком Nsight?
но я не вижу этого в (моей версии) NSight Compute.
2 ответа
Nsight Compute не поддерживается и не рекомендуется в качестве профилировщика для графических процессоров с вычислительными возможностями до версии 7.0 .
Не существует формального определения поведения инструмента в неподдерживаемых настройках. Считайте это УБ.
Используйте устаревший профилировщик (nvvp, nvprof) для графического процессора с вычислительными возможностями до версии cc7.0.
Профилирование ядра с помощью Nsight Compute 2019.5 на графическом процессоре Pascal (sm_61), показатели
LG Throttle
а также
Sleeping
которые требуют 7.0+, не отображаются как причины зависания.