Использование ncu для профилирования pagefault в объединенной памяти
есть ли возможность профилировать приложение CUDA для унифицированной виртуальной памяти с помощью Nsight Compute (NCU)? Например, я хочу знать, сколько времени тратится на обработку ошибок страницы и миграцию.
1 ответ
Решение
Наконец, я сам придумал решение. Просто нужно указать
--export=json
для вывода результата профилирования в файл json, чтобы получить подробные метрики ошибки страницы. Общая команда профилирования выглядит так.
nsys profile \
--force-overwrite=true \
--cuda-um-gpu-page-faults=true \
--cuda-um-cpu-page-faults=true \
--export=json \
./yourapplication