Описание тега opt
0
ответов
Как я могу запустить пользовательские проходы LLVM для IR-файла LLVM кода CUDA с помощью opt?
У меня возникла проблема с запуском пользовательских проходов LLVM для файла «.ll» кода CUDA. Например, у меня есть пример кода CUDA с именемsample1.cu. Я скомпилировал код CUDA, используя следующую команду. ./bin/clang++ -flegacy-pass-manager -g -X…
22 июл '23 в 11:21
0
ответов
DeepSpeed: ни один оператор не соответствует ошибке операндов
Когда я пытаюсь использовать пример DeepSpeed для точной настройки модели OPT 1.3b на моем локальном компьютере, у меня возникает непредвиденная ошибка, связанная со следующим фрагментом кода: template <typename T> __global__ void moe_res_ma…
15 июн '23 в 06:46