Описание тега intel-pmu

Вопросы, связанные с использованием Intel Performance Management Unit, который предоставляет счетчики производительности, связанные с производительностью выполняемого в данный момент кода.
1 ответ

Как я могу прочитать счетчики производительности из ядра?

Я использую инструмент Linux perf в пользовательском пространстве. Я хочу написать код, который читает счетчики производительности для потока каждый раз, когда он выполняет переключение контекста. Необходимые шаги: 1) Получить механизм для чтения ре…
20 фев '19 в 08:21
1 ответ

Как настроить и отобрать счетчики производительности Intel в процессе работы

Короче говоря, я пытаюсь добиться следующего в процессе тестирования пользовательского пространства (псевдокод, предполагая x86_64 и систему UNIX): results[] = ... for (iteration = 0; iteration < num_iterations; iteration++) { pctr_start = sample…
18 авг '16 в 15:06
4 ответа

Счетчик производительности оборудования на Intel Core Duo

Я читал, что есть процессоры AMD, которые позволяют измерять количество попаданий и пропаданий в кеше. Мне интересно, доступна ли такая функция на машинах Intel Core Duo или они еще не поддерживают эту функцию.
09 ноя '10 в 13:44
0 ответов

Счетчик питания на процессоре Intel или графических процессорах

Кто-нибудь имеет опыт работы со счетчиками питания на процессорах Intel (библиотека управления счетчиками производительности Intel) или графических процессорах, какие типы процессоров и графических процессоров поддерживают такие счетчики, насколько …
25 сен '13 в 18:10
2 ответа

Надежность профилирования времени разборки Xcode Instrument

Я профилировал свой код, используя профилировщик времени прибора, и увеличив масштаб до разборки, вот фрагмент его результатов: Я бы не ожидал mov инструкция брать 23,3% времени, пока div Инструкция брать практически нечего. Это заставляет меня пола…
21 янв '18 в 16:58
0 ответов

Получить прерывание мониторинга производительности на Qemu-Kvm

У меня есть ситуация с перехватом прерывания мониторинга производительности (PMI - особенно счетчик команд) на qemu-kvm. Приведенный ниже код отлично работает на реальной машине (Intel Core TM i5-4300U), но на qemu-kvm (хост qemu-system-x86_64 -cpu)…
2 ответа

Почему число мопов за итерацию увеличивается с увеличением потоковой загрузки?

Рассмотрим следующий цикл: .loop: add rsi, OFFSET mov eax, dword [rsi] dec ebp jg .loop где OFFSET некоторое неотрицательное целое число и rsi содержит указатель на буфер, определенный в bss раздел. Этот цикл является единственным циклом в коде. То …
26 сен '18 в 23:25
0 ответов

spdecode в simple-pt отвечает "поток трассировки ошибок не соответствует запросу" Intel Processor Trace

Я новичок, использующий Intel PT для трассировки. Я прочитал руководство по Intel PT и начал использовать его с simple-pt, чтобы понять, как работает Intel PT. sptcmd команда в simple-pt работает и генерирует ptout.N с помощью следующей команды. sud…
12 дек '18 в 20:44
1 ответ

Событие Intel PMU для события попадания в кэш L1

Я пытаюсь подсчитать количество попаданий в кэш на разных уровнях (L1, L2 и L3) для программы на процессоре Intel Haswell. Я написал программу для подсчета количества попаданий в кэш L2 и L3, отслеживая соответствующие события. Чтобы добиться этого,…
01 мар '18 в 03:42
0 ответов

Выборка Intel PEBS гостя со стороны хоста

Я пытаюсь попробовать гостевую ОС с хост-машины. Я прошел патч "kvm: Внедрение виртуализации PEBS" Энди Клин. Чтобы настроить гостевую PEBS, я написал LKM в гостевой системе, которая выделяет область сохранения DS, устанавливает поля debug_store и, …
20 июл '18 в 16:34
0 ответов

Как сбросить счетчик производительности общего назначения Intel

Я знаю, что мы можем использовать wrmsr а также rdmsr инструкция по установке счетчика производительности и считывание регистра счетчика производительности общего назначения. Тем не менее, мой вопрос: Нужно ли сбрасывать регистр счетчика производите…
29 янв '14 в 00:48
0 ответов

Что вызывает события производительности DTLB_LOAD_MISSES.WALK_*?

Рассмотрим следующий цикл: .loop: add rsi, STRIDE mov eax, dword [rsi] dec ebp jg .loop где STRIDE некоторое неотрицательное целое число и rsi содержит указатель на буфер, определенный в bss раздел. Этот цикл является единственным циклом в коде. То …
29 сен '18 в 22:05
5 ответов

Можно ли использовать счетчики монитора производительности Intel для измерения пропускной способности памяти?

Можно ли использовать Intel PMU для измерения пропускной способности памяти для чтения / записи на ядро? Здесь "память" означает DRAM (то есть не попадает ни на один уровень кэша).
02 дек '17 в 21:37
2 ответа

Можем ли мы измерить успешную пересылку магазина с помощью счетчиков производительности Intel?

Можно ли измерить количество успешных операций пересылки в хранилище, используя счетчики производительности на последних чипах Intel x86? Я вижу события для ld_blocks.store_forward какая мера провалилась в магазине, но мне ясно, можно ли измерить ус…
09 сен '17 в 22:54
0 ответов

Определите фиксированный счетчик для отображения событий с помощью libpfm4

Я использую libpfm4 для определения кодировок счетчиков монитора производительности Intel (например, для сопоставления удобочитаемого имени и кодировки). Intel PMU имеет несколько "фиксированных счетчиков", которые можно включать или отключать, но п…
14 окт '17 в 19:15
1 ответ

Возможно ли событие RESOURCE_STALLS.RS произойти, даже если RS не полностью заполнен?

Описание RESOURCE_STALLS.RS Событие производительности оборудования для Intel Broadwell следующее: Это событие подсчитывает циклы останова, вызванные отсутствием подходящих записей на станции резервирования (RS). Это может произойти из-за переполнен…
1 ответ

Какое ограничение на самом деле perf_event_paranoid == 1 накладывает на x86 perf?

Более новые ядра Linux имеют настраиваемый sysfs /proc/sys/kernel/perf_event_paranoid который позволяет пользователю настроить доступную функциональность perf_events для пользователей без полномочий root: более высокие номера более безопасны (предла…
18 авг '18 в 18:08
0 ответов

Почему Linux perf использует событие l1d.replacement для "L1 dcache misses" на x86?

На Intel x86 Linux использует событие l1d.replacements реализовать его L1-dcache-load-misses событие. Это событие определяется следующим образом: Подсчитывает замены строк данных L1D, включая случайные замены, и замены, которые требуют остановки или…
04 сен '18 в 20:20
0 ответов

Как сузить данные Intel PCM до единого процесса?

Я пытаюсь использовать Intel Performance Counter Monitor (PCM), чтобы понять отсутствие кэш-памяти L3 и некоторые другие критерии производительности в моем коде. Я не уверен, как разобраться в числах, которые я получаю, и был бы признателен за поним…
01 мар '19 в 22:42
1 ответ

Аппаратный кеш событий и перф

Когда я бегу perf list Я вижу кучу событий Hardware Cache следующим образом: $ perf list | grep 'cache event' L1-dcache-load-misses [Hardware cache event] L1-dcache-loads [Hardware cache event] L1-dcache-stores [Hardware cache event] L1-icache-load-…
04 сен '18 в 16:58