Отладка встроенного PTX в Parallel Nsight

Можно ли просматривать регистры PTX при переходе через встроенный PTX в Parallel Nsight?

Я могу установить точки останова на встроенном PTX и пройти через него, но при наведении курсора на регистры PTX не отображаются их значения. Я могу включить SASS, и при наведении на эти регистры отображаются их значения, но сложно отслеживать взаимосвязи между регистрами PTX и регистрами SASS.

1 ответ

Решение

К сожалению, графический процессор не может выполнять PTX напрямую, он может выполнять только микрокод SASS. Поскольку JIT-компилятор в драйвере (который переводит PTX->SASS) действительно имеет возможность существенно изменить код PTX во время компиляции, выполняя такие оптимизации, как устранение общих подвыражений, ваши наблюдения показывают, что 1) "трудно отслеживать отношения между регистрами PTX и регистрами SASS "и 2) вы не можете проверить регистры PTX во время выполнения, все слишком точно.

Я не ожидаю, что любое из этих ограничений будет снято в обозримом будущем.

Другие вопросы по тегам