Описание тега roofline
0
ответов
Транспонирование вертикальных срезов трехмерного тензора для повышения производительности
У меня есть 3D-тензор, который представляет собой непрерывный блок памяти. Чтобы лучше анализировать производительность, я убедился, что этот блок может находиться в кэше L3 моей системы. Так что в лучшем случае я смогу достичь уровня L3-полосы проп…
20 дек '21 в 11:38
0
ответов
Консультации / Руководство по анализу модели кровли (Skylake, Thunder X2, Haswell)
В настоящее время я изучаю графики пропускной способности / памяти и производительности ЦП, а также графики уровня крыши, и мне бы хотелось получить помощь / информацию о том, как анализировать следующий рисунок. Рисунок крыши с сайта "https://www.m…
20 дек '21 в 20:16
0
ответов
Построение модели Roofline с нуля
Я недавно взял в руки модель линии крыши, и я новичок в ней. Я пытаюсь построить один для Intel Xeon W-2133, но для одноядерных и однопоточных приложений. Пиковое значение GFLOPS для Intel Xeon W-2133 согласно приведенным здесь данным составляет 537…
28 дек '21 в 11:20
1
ответ
Вычисление NSIGHT: SOL SM против Roofline
Я запустил cuda-11.2 nsight-compute на своем ядре cuda. Он сообщает, что SOL SM составляет 79,44%, что я интерпретирую как довольно близкое к максимуму. SOL L1 составляет 48,38% Когда я изучаю диаграмму Roofline , я вижу, что мой измеренный результа…
08 янв '21 в 17:04
0
ответов
Информация о пропускной способности Intel Advisor
При использовании представления анализа крыши Intel Advisor нам предоставляется информация о пропускной способности данных для различных путей данных системы, т. е. кэшей DRAM, L3, L2 и L1. Программа утверждает, что она измеряет пропускную способнос…
10 мар '22 в 09:13
0
ответов
Модель Roofline: как увеличение арифметической интенсивности позволяет улучшить производительность?
Совет от Intel: если вы не можете сломать крышу памяти, попробуйте переработать свой алгоритм для более интенсивной арифметической обработки. Это сдвинет вас вправо и даст вам больше возможностей для повышения производительности, прежде чем вы дост…
06 мар '22 в 07:31
0
ответов
Как рассчитать арифметическую интенсивность?
У меня есть следующий фрагмент кода, из которого я должен вычислить арифметическую интенсивность. const int N = 8192; float a[N], b[N], c[N], d[N]; ... #pragma omp parallel for simd for(int i = 0; i < N; i++) { const float tmp_a = a[i]; const flo…
12 янв '23 в 11:01
1
ответ
Подход к оптимизации модели линии крыши
У меня есть несколько вопросов о модели линии крыши о том, как работать с точкой, привязанной к памяти. Вопросы: 1) Если I0, полученный из I0.BW=Peak, равен 1,21, а фактический I1 равен 0,71, означает ли это, что фактический I1 находится в памяти? 2…
09 окт '22 в 09:59
0
ответов
Вопрос о потолках пропускной способности в моделях линии крыши
Я не совсем понимаю коэффициент пропускной способности в моделях линии крыши, описанных в Википедии (например, рисунок и подпись к нему, показанные ниже): почему пересечение между β x I и осями может быть изменено? Почему может быть производительнос…
29 авг '22 в 18:40
0
ответов
Одна точка находится за пределами области модели Roofline
Я использовал модель линии крыши для анализа оптимизации кода. Но я обнаружил, что точка с зеленым цветом находится вне области границы полосы пропускания. Программа может работать без проблем. Я не понимаю, почему зеленая точка не находится в облас…
27 окт '22 в 07:49
0
ответов
Как Intel Advisor измеряет пропускную способность L1, L2 и L3 для контуров и функций? Существуют ли события PMU, которые подсчитывают переданные байты?
Я использую функцию крыши с поддержкой кэша Intel Advisor и хотел бы знать, как Intel Advisor измеряет пропускную способность кэша данных от ядра до L1 приложения. Приложение запускается дважды: один раз для сбора информации о синхронизации циклов и…
23 авг '23 в 08:17
1
ответ
Модель линии крыши с руководством по CUDA и Nsight Compute
У меня есть очень простое ядро векторного сложения, написанное для CUDA. Я хочу рассчитать арифметическую интенсивность, а также GFLOP/s для этого ядра. Рассчитанные мной значения заметно отличаются от значений, полученных в разделе «Анализ линии …
12 июл '23 в 19:10