Описание тега roofline

0 ответов

Транспонирование вертикальных срезов трехмерного тензора для повышения производительности

У меня есть 3D-тензор, который представляет собой непрерывный блок памяти. Чтобы лучше анализировать производительность, я убедился, что этот блок может находиться в кэше L3 моей системы. Так что в лучшем случае я смогу достичь уровня L3-полосы проп…
20 дек '21 в 11:38
0 ответов

Консультации / Руководство по анализу модели кровли (Skylake, Thunder X2, Haswell)

В настоящее время я изучаю графики пропускной способности / памяти и производительности ЦП, а также графики уровня крыши, и мне бы хотелось получить помощь / информацию о том, как анализировать следующий рисунок. Рисунок крыши с сайта "https://www.m…
20 дек '21 в 20:16
0 ответов

Построение модели Roofline с нуля

Я недавно взял в руки модель линии крыши, и я новичок в ней. Я пытаюсь построить один для Intel Xeon W-2133, но для одноядерных и однопоточных приложений. Пиковое значение GFLOPS для Intel Xeon W-2133 согласно приведенным здесь данным составляет 537…
28 дек '21 в 11:20
1 ответ

Вычисление NSIGHT: SOL SM против Roofline

Я запустил cuda-11.2 nsight-compute на своем ядре cuda. Он сообщает, что SOL SM составляет 79,44%, что я интерпретирую как довольно близкое к максимуму. SOL L1 составляет 48,38% Когда я изучаю диаграмму Roofline , я вижу, что мой измеренный результа…
08 янв '21 в 17:04
0 ответов

Информация о пропускной способности Intel Advisor

При использовании представления анализа крыши Intel Advisor нам предоставляется информация о пропускной способности данных для различных путей данных системы, т. е. кэшей DRAM, L3, L2 и L1. Программа утверждает, что она измеряет пропускную способнос…
0 ответов

Модель Roofline: как увеличение арифметической интенсивности позволяет улучшить производительность?

Совет от Intel: если вы не можете сломать крышу памяти, попробуйте переработать свой алгоритм для более интенсивной арифметической обработки. Это сдвинет вас вправо и даст вам больше возможностей для повышения производительности, прежде чем вы дост…
06 мар '22 в 07:31
0 ответов

Как рассчитать арифметическую интенсивность?

У меня есть следующий фрагмент кода, из которого я должен вычислить арифметическую интенсивность. const int N = 8192; float a[N], b[N], c[N], d[N]; ... #pragma omp parallel for simd for(int i = 0; i < N; i++) { const float tmp_a = a[i]; const flo…
1 ответ

Подход к оптимизации модели линии крыши

У меня есть несколько вопросов о модели линии крыши о том, как работать с точкой, привязанной к памяти. Вопросы: 1) Если I0, полученный из I0.BW=Peak, равен 1,21, а фактический I1 равен 0,71, означает ли это, что фактический I1 находится в памяти? 2…
09 окт '22 в 09:59
0 ответов

Вопрос о потолках пропускной способности в моделях линии крыши

Я не совсем понимаю коэффициент пропускной способности в моделях линии крыши, описанных в Википедии (например, рисунок и подпись к нему, показанные ниже): почему пересечение между β x I и осями может быть изменено? Почему может быть производительнос…
0 ответов

Одна точка находится за пределами области модели Roofline

Я использовал модель линии крыши для анализа оптимизации кода. Но я обнаружил, что точка с зеленым цветом находится вне области границы полосы пропускания. Программа может работать без проблем. Я не понимаю, почему зеленая точка не находится в облас…
27 окт '22 в 07:49
0 ответов

Как Intel Advisor измеряет пропускную способность L1, L2 и L3 для контуров и функций? Существуют ли события PMU, которые подсчитывают переданные байты?

Я использую функцию крыши с поддержкой кэша Intel Advisor и хотел бы знать, как Intel Advisor измеряет пропускную способность кэша данных от ядра до L1 приложения. Приложение запускается дважды: один раз для сбора информации о синхронизации циклов и…
23 авг '23 в 08:17
1 ответ

Модель линии крыши с руководством по CUDA и Nsight Compute

У меня есть очень простое ядро ​​векторного сложения, написанное для CUDA. Я хочу рассчитать арифметическую интенсивность, а также GFLOP/s для этого ядра. Рассчитанные мной значения заметно отличаются от значений, полученных в разделе «Анализ линии …
12 июл '23 в 19:10