Использование ncu для профилирования pagefault в объединенной памяти

есть ли возможность профилировать приложение CUDA для унифицированной виртуальной памяти с помощью Nsight Compute (NCU)? Например, я хочу знать, сколько времени тратится на обработку ошибок страницы и миграцию.

1 ответ

Решение

Наконец, я сам придумал решение. Просто нужно указать --export=jsonдля вывода результата профилирования в файл json, чтобы получить подробные метрики ошибки страницы. Общая команда профилирования выглядит так.

      nsys profile \
     --force-overwrite=true \
     --cuda-um-gpu-page-faults=true \
     --cuda-um-cpu-page-faults=true \
     --export=json \
     ./yourapplication
Другие вопросы по тегам