В чем разница между 5 уровнями оптимизации драйвера CUDA?

Когда вы используете драйвер CUDA для компиляции кода PTX в SASS, вы можете указать уровень оптимизации:

CU_JIT_OPTIMIZATION_LEVEL
Уровень оптимизации, применяемый к сгенерированному коду (0–4), при этом 4 - это самый высокий уровень оптимизации по умолчанию. Тип опции: unsigned int Применимо только к компилятору

Очевидно, что оптимизация идет от наименьшей оптимизации с наименьшими затратами времени на оптимизацию, другая крайность. Но - что на самом деле делается на уровнях оптимизации по умолчанию? В частности: GCC и clang имеют уровни от 0 до 3; почему 4 уровень?

0 ответов

Другие вопросы по тегам