Показатели производительности CUDA

Каковы глобальный уровень и локальный уровень? Как рассчитать их. Я не использовал текстурную память в моем ядре. Почему l2_tex_read_hit_rate отличен от нуля? Является ли частота попаданий в кэш единой кэш-памяти? Вот часть метрической информации, которую я получил при профилировании моего ядра с помощью nvprof.

          1                           global_hit_rate                                       Global Hit Rate       9.57%       9.57%       9.57%
          1                            local_hit_rate                                        Local Hit Rate       0.00%       0.00%       0.00%
          1                        tex_cache_hit_rate                                Unified Cache Hit Rate      10.57%      10.57%      10.57%
          1                      l2_tex_read_hit_rate                           L2 Hit Rate (Texture Reads)      13.76%      13.76%      13.76%

0 ответов

Другие вопросы по тегам