Описание тега intel-pmu

Описание тега Вопросы с тегом

Вопросы, связанные с использованием Intel Performance Management Unit, который предоставляет счетчики производительности, связанные с производительностью выполняемого в данный момент кода.

1 ответ

Как я могу прочитать счетчики производительности из ядра?

Я использую инструмент Linux perf в пользовательском пространстве. Я хочу написать код, который читает счетчики производительности для потока каждый раз, когда он выполняет переключение контекста. Необходимые шаги: 1) Получить механизм для чтения ре…

linux-kernel perf intel-pmu

20 фев '19 в 08:21

1 ответ

Как настроить и отобрать счетчики производительности Intel в процессе работы

Короче говоря, я пытаюсь добиться следующего в процессе тестирования пользовательского пространства (псевдокод, предполагая x86_64 и систему UNIX): results[] = ... for (iteration = 0; iteration < num_iterations; iteration++) { pctr_start = sample…

linux x86 benchmarking perf intel-pmu

18 авг '16 в 15:06

4 ответа

Счетчик производительности оборудования на Intel Core Duo

Я читал, что есть процессоры AMD, которые позволяют измерять количество попаданий и пропаданий в кеше. Мне интересно, доступна ли такая функция на машинах Intel Core Duo или они еще не поддерживают эту функцию.

performance x86 intel processor intel-pmu

09 ноя '10 в 13:44

0 ответов

Счетчик питания на процессоре Intel или графических процессорах

Кто-нибудь имеет опыт работы со счетчиками питания на процессорах Intel (библиотека управления счетчиками производительности Intel) или графических процессорах, какие типы процессоров и графических процессоров поддерживают такие счетчики, насколько …

gpu counter cpu intel intel-pmu

25 сен '13 в 18:10

2 ответа

Надежность профилирования времени разборки Xcode Instrument

Я профилировал свой код, используя профилировщик времени прибора, и увеличив масштаб до разборки, вот фрагмент его результатов: Я бы не ожидал mov инструкция брать 23,3% времени, пока div Инструкция брать практически нечего. Это заставляет меня пола…

xcode x86 profiling instruments intel-pmu

21 янв '18 в 16:58

0 ответов

Получить прерывание мониторинга производительности на Qemu-Kvm

У меня есть ситуация с перехватом прерывания мониторинга производительности (PMI - особенно счетчик команд) на qemu-kvm. Приведенный ниже код отлично работает на реальной машине (Intel Core TM i5-4300U), но на qemu-kvm (хост qemu-system-x86_64 -cpu)…

linux-kernel qemu kvm performancecounter intel-pmu

09 мар '18 в 17:16

2 ответа

Почему число мопов за итерацию увеличивается с увеличением потоковой загрузки?

Рассмотрим следующий цикл: .loop: add rsi, OFFSET mov eax, dword [rsi] dec ebp jg .loop где OFFSET некоторое неотрицательное целое число и rsi содержит указатель на буфер, определенный в bss раздел. Этот цикл является единственным циклом в коде. То …

assembly x86 cpu-architecture intel-pmu

26 сен '18 в 23:25

0 ответов

spdecode в simple-pt отвечает "поток трассировки ошибок не соответствует запросу" Intel Processor Trace

Я новичок, использующий Intel PT для трассировки. Я прочитал руководство по Intel PT и начал использовать его с simple-pt, чтобы понять, как работает Intel PT. sptcmd команда в simple-pt работает и генерирует ptout.N с помощью следующей команды. sud…

debugging x86 intel trace intel-pmu

12 дек '18 в 20:44

1 ответ

Событие Intel PMU для события попадания в кэш L1

Я пытаюсь подсчитать количество попаданий в кэш на разных уровнях (L1, L2 и L3) для программы на процессоре Intel Haswell. Я написал программу для подсчета количества попаданий в кэш L2 и L3, отслеживая соответствующие события. Чтобы добиться этого,…

x86 perf cpu-cache intel-pmu

01 мар '18 в 03:42

0 ответов

Выборка Intel PEBS гостя со стороны хоста

Я пытаюсь попробовать гостевую ОС с хост-машины. Я прошел патч "kvm: Внедрение виртуализации PEBS" Энди Клин. Чтобы настроить гостевую PEBS, я написал LKM в гостевой системе, которая выделяет область сохранения DS, устанавливает поля debug_store и, …

linux-kernel kvm perf intel-pmu

20 июл '18 в 16:34

0 ответов

Как сбросить счетчик производительности общего назначения Intel

Я знаю, что мы можем использовать wrmsr а также rdmsr инструкция по установке счетчика производительности и считывание регистра счетчика производительности общего назначения. Тем не менее, мой вопрос: Нужно ли сбрасывать регистр счетчика производите…

performance assembly x86 intel-pmu msr

29 янв '14 в 00:48

0 ответов

Что вызывает события производительности DTLB_LOAD_MISSES.WALK_*?

Рассмотрим следующий цикл: .loop: add rsi, STRIDE mov eax, dword [rsi] dec ebp jg .loop где STRIDE некоторое неотрицательное целое число и rsi содержит указатель на буфер, определенный в bss раздел. Этот цикл является единственным циклом в коде. То …

x86 cpu-architecture tlb intel-pmu

29 сен '18 в 22:05

5 ответов

Можно ли использовать счетчики монитора производительности Intel для измерения пропускной способности памяти?

Можно ли использовать Intel PMU для измерения пропускной способности памяти для чтения / записи на ядро? Здесь "память" означает DRAM (то есть не попадает ни на один уровень кэша).

performance x86 intel-pmu

02 дек '17 в 21:37

2 ответа

Можем ли мы измерить успешную пересылку магазина с помощью счетчиков производительности Intel?

Можно ли измерить количество успешных операций пересылки в хранилище, используя счетчики производительности на последних чипах Intel x86? Я вижу события для ld_blocks.store_forward какая мера провалилась в магазине, но мне ясно, можно ли измерить ус…

performance x86 intel-pmu

09 сен '17 в 22:54

0 ответов

Определите фиксированный счетчик для отображения событий с помощью libpfm4

Я использую libpfm4 для определения кодировок счетчиков монитора производительности Intel (например, для сопоставления удобочитаемого имени и кодировки). Intel PMU имеет несколько "фиксированных счетчиков", которые можно включать или отключать, но п…

x86 intel intel-pmu libpfm4

14 окт '17 в 19:15

1 ответ

Возможно ли событие RESOURCE_STALLS.RS произойти, даже если RS не полностью заполнен?

Описание RESOURCE_STALLS.RS Событие производительности оборудования для Intel Broadwell следующее: Это событие подсчитывает циклы останова, вызванные отсутствием подходящих записей на станции резервирования (RS). Это может произойти из-за переполнен…

performance x86 cpu-architecture intel intel-pmu

05 окт '18 в 00:15

1 ответ

Какое ограничение на самом деле perf_event_paranoid == 1 накладывает на x86 perf?

Более новые ядра Linux имеют настраиваемый sysfs /proc/sys/kernel/perf_event_paranoid который позволяет пользователю настроить доступную функциональность perf_events для пользователей без полномочий root: более высокие номера более безопасны (предла…

linux-kernel x86 profiling perf intel-pmu

18 авг '18 в 18:08

0 ответов

Почему Linux perf использует событие l1d.replacement для "L1 dcache misses" на x86?

На Intel x86 Linux использует событие l1d.replacements реализовать его L1-dcache-load-misses событие. Это событие определяется следующим образом: Подсчитывает замены строк данных L1D, включая случайные замены, и замены, которые требуют остановки или…

linux x86 profiling perf intel-pmu

04 сен '18 в 20:20

0 ответов

Как сузить данные Intel PCM до единого процесса?

Я пытаюсь использовать Intel Performance Counter Monitor (PCM), чтобы понять отсутствие кэш-памяти L3 и некоторые другие критерии производительности в моем коде. Я не уверен, как разобраться в числах, которые я получаю, и был бы признателен за поним…

intel performancecounter cpu-cache intel-pmu

01 мар '19 в 22:42

1 ответ

Аппаратный кеш событий и перф

Когда я бегу perf list Я вижу кучу событий Hardware Cache следующим образом: $ perf list | grep 'cache event' L1-dcache-load-misses [Hardware cache event] L1-dcache-loads [Hardware cache event] L1-dcache-stores [Hardware cache event] L1-icache-load-…

linux performance x86 perf intel-pmu

04 сен '18 в 16:58