Лимит регистров на поток Alea GPU (--maxregcount)
Nvidia Visual Profiler рекомендует попробовать скомпилировать с флагом maxregcount. Есть ли что-нибудь эквивалентное в Alea GPU и как оно используется?
Я использую JIT-компиляцию и обнаружил опцию JITMaxRegisters, но, похоже, она не влияет на количество регистров в потоке.
{ worker.DefaultCompileOptions.ToProfilingConfig ()
with JITMaxRegisters = Some 60;
MinimalArch = DeviceArch.Create("sm35")}
С этой опцией компиляции визуальный профилировщик все еще говорит, что 72 регистра / поток используются.
Существуют ли какие-либо эквиваленты maxregcount или __launch_bounds__, которые мне не хватает?