Компилировать код ptx на GPU NVIDIA?

Я хочу перехватывать на уровне PTX программы opencl на GPU NVIDIA.

Я предполагаю, что рутина, вероятно, будет выглядеть так.

Сначала я пишу программу opencl (код хоста и устройства), используя компилятор NVIDIA для создания соответствующего кода ptx. Затем я пишу, что хочу сделать, изменяя код PTX (пожалуйста, не спрашивайте, почему я не сделал этого на коде устройства C - у меня есть некоторые причины для этого). Но проблема в том, как после изменения, как мне скомпилировать этот код PTX в двоичный код?

1 ответ

Вы можете использовать ptxas, который включен в инструментарий CUDA. Он компилирует.ptx в.cubin, который затем может быть загружен с помощью API драйвера.

Другие вопросы по тегам