Показатели производительности CUDA
Каковы глобальный уровень и локальный уровень? Как рассчитать их. Я не использовал текстурную память в моем ядре. Почему l2_tex_read_hit_rate отличен от нуля? Является ли частота попаданий в кэш единой кэш-памяти? Вот часть метрической информации, которую я получил при профилировании моего ядра с помощью nvprof.
1 global_hit_rate Global Hit Rate 9.57% 9.57% 9.57%
1 local_hit_rate Local Hit Rate 0.00% 0.00% 0.00%
1 tex_cache_hit_rate Unified Cache Hit Rate 10.57% 10.57% 10.57%
1 l2_tex_read_hit_rate L2 Hit Rate (Texture Reads) 13.76% 13.76% 13.76%