Отладка встроенного PTX в Parallel Nsight
Можно ли просматривать регистры PTX при переходе через встроенный PTX в Parallel Nsight?
Я могу установить точки останова на встроенном PTX и пройти через него, но при наведении курсора на регистры PTX не отображаются их значения. Я могу включить SASS, и при наведении на эти регистры отображаются их значения, но сложно отслеживать взаимосвязи между регистрами PTX и регистрами SASS.
1 ответ
К сожалению, графический процессор не может выполнять PTX напрямую, он может выполнять только микрокод SASS. Поскольку JIT-компилятор в драйвере (который переводит PTX->SASS) действительно имеет возможность существенно изменить код PTX во время компиляции, выполняя такие оптимизации, как устранение общих подвыражений, ваши наблюдения показывают, что 1) "трудно отслеживать отношения между регистрами PTX и регистрами SASS "и 2) вы не можете проверить регистры PTX во время выполнения, все слишком точно.
Я не ожидаю, что любое из этих ограничений будет снято в обозримом будущем.