Описание тега iaca

IACA (анализатор архитектуры Intel) - это инструмент статического анализа, разработанный Intel для помощи программистам в оптимальном планировании инструкций для современных процессоров архитектуры Intel, начиная с Nehalem.
0 ответов

Почему моя программа с маркерами IACA компилируется, а не при первой компиляции в сборку?

Я пытаюсь выполнить профилирование кода с помощью Intel IACA. Я использовал этот вопрос переполнения стека, чтобы настроить производителей. У меня проблема в том, что если я использую gcc и компилирую прямо из исходного кода в бинарный файл, я в пор…
30 июн '15 в 16:05
1 ответ

Разница в производительности между двумя, казалось бы, эквивалентными кодами сборки

tl; dr: у меня есть два функционально эквивалентных C-кода, которые я компилирую с Clang (тот факт, что это C-код не имеет большого значения; мне кажется, интересна только сборка), и IACA говорит мне, что один должен быть быстрее, но я Я не понимаю,…
07 авг '18 в 09:52
1 ответ

Использование IACA с процедурой не-сборки

Я играл с IACA (статический анализатор кода Intel).Он отлично работает при тестировании с фрагментами сборки, где я могу вручную ввести байты магического маркера, например: procedure TSlice.BitSwap(a, b: integer); asm //RCX = self //edx = a //r8d = …
19 сен '17 в 12:44
4 ответа

Режимы микросинтеза и адресации

Я обнаружил что-то неожиданное (для меня) с помощью анализатора кода архитектуры Intel® (IACA). Следующая инструкция с использованием [base+index] адресация addps xmm1, xmmword ptr [rsi+rax*1] не микроплавкий согласно IACA. Однако, если я использую …
25 сен '14 в 19:33
1 ответ

Что такое IACA и как мне его использовать?

Я нашел этот интересный и мощный инструмент под названием IACA (анализатор кода архитектуры Intel), но у меня проблемы с его пониманием. Что я могу с этим сделать, каковы его ограничения и как я могу: Использовать его для анализа кода на C или C++? …
24 сен '14 в 15:53
1 ответ

Intel Broadwell UOP Fusion для инструкций загрузки / хранения AVX

Я пытаюсь определить базовый уровень производительности для векторизованных циклов, связанных с памятью. Я делаю это на чипе Intel Broadwell с инструкциями AVX2 в 32-байтовой выровненной среде. Базовый цикл использует 8 регистров YMM одновременно дл…
05 мар '16 в 21:02
1 ответ

Intel IACA анализатор изменяет сборку?

Я хотел запустить некоторый код через анализатор IACA, чтобы увидеть, сколько он использовал мопов - я начал с простой функции, чтобы увидеть, работает ли она... К сожалению, когда я вставляю макросы, которые IACA говорит использовать, результирующа…
16 май '19 в 05:16
0 ответов

Как создать отчет анализа IACA для программы переменного тока?

Я хотел бы проанализировать эффект, если он есть,#pragma GCC unroll nимеет простую программу суммирования цикла for на C. Из своего исследования я узнал об инструменте IACA и загрузил его, но мне трудно получить отчет об анализе, как показано здесь.…
08 дек '22 в 18:04