Что показывает NSight Compute по причине задержки, которая не «поддерживается»?

В Руководстве по профилированию CUDA перечислены различные причины выборочных остановок деформации, например, выделение, барьер, дроссельная заслонка LG и т. д. И профайлер NSight Compute показывает их распределение как часть результатов профилирования.

Дело в том, что некоторые причины зависаний перечислены как поддерживаемые только начиная с некоторых вычислительных возможностей, например «LG Throttle: 7.0+».

Мой вопрос: что происходит в устройствах с более ранними вычислительными возможностями, когда причиной остановки является эта «неподдерживаемая» причина? Или, другими словами, каков запасной вариант для каждой из перечисленных причин остановки?

В Ye Olde NVIDIA Visual Profiler у нас была «Другая» причина задержки, см.:

Каковы «другие» причины приостановки работы, отображаемые профилировщиком Nsight?

но я не вижу этого в (моей версии) NSight Compute.

2 ответа

Nsight Compute не поддерживается и не рекомендуется в качестве профилировщика для графических процессоров с вычислительными возможностями до версии 7.0 .

Не существует формального определения поведения инструмента в неподдерживаемых настройках. Считайте это УБ.

Используйте устаревший профилировщик (nvvp, nvprof) для графического процессора с вычислительными возможностями до версии cc7.0.

Профилирование ядра с помощью Nsight Compute 2019.5 на графическом процессоре Pascal (sm_61), показатели LG Throttleа также Sleepingкоторые требуют 7.0+, не отображаются как причины зависания.

Другие вопросы по тегам