Описание тега opt

0 ответов

Как я могу запустить пользовательские проходы LLVM для IR-файла LLVM кода CUDA с помощью opt?

У меня возникла проблема с запуском пользовательских проходов LLVM для файла «.ll» кода CUDA. Например, у меня есть пример кода CUDA с именемsample1.cu. Я скомпилировал код CUDA, используя следующую команду. ./bin/clang++ -flegacy-pass-manager -g -X…
22 июл '23 в 11:21
0 ответов

DeepSpeed: ни один оператор не соответствует ошибке операндов

Когда я пытаюсь использовать пример DeepSpeed ​​для точной настройки модели OPT 1.3b на моем локальном компьютере, у меня возникает непредвиденная ошибка, связанная со следующим фрагментом кода: template <typename T> __global__ void moe_res_ma…
15 июн '23 в 06:46