Используйте этот тег, чтобы задавать вопросы о Intel® VTune™ Profiler, который представляет собой расширенный профилировщик производительности для поиска и оптимизации узких мест производительности в системах ЦП, графических процессоров и FPGA.
1 ответ

Как имитировать высокую активность хранилища в приложении C++

Какими способами можно помочь выявить проблемы в большом многопоточном приложении C++, которые могут быть обременены доступом к хранилищу ввода-вывода? Я могу проанализировать приложение, чтобы найти конкретные замедления для определенных прогонов, …
30 июл '14 в 14:39
2 ответа

Профилирование системы - информация об использовании общих библиотек

Есть ли способ узнать, какие библиотечные файлы используются каким процессом (или количеством процессов) за определенный промежуток времени. Можно ли использовать для этого V-Tune, perf или OProfile?
1 ответ

Какой способ профилирования лучше использовать VTUNE: автономный или интегрированный с MSVC?

Я получаю определенные ошибки при запуске VTUNE в автономном режиме, но все работает нормально, если я запускаю его из MSVC IDE.Будут ли какие-либо неточности в отчетах, если я буду запускать VTUNE из MSVC?
15 ноя '13 в 10:15
1 ответ

Vtune общее время в функции MKL

Я работаю над университетским проектом, в котором меня просят рассказать о некоторых трехдиагональных автоматах, реализованных в MKL (11.1.). Поэтому я реализовал для этого несколько тестовых площадок, и сейчас я пытаюсь профилировать это в vtune (I…
24 июл '15 в 14:45
0 ответов

Основные горячие точки против расширенных горячих точек относительно использования ЦП (отличаются)

Почему использование ЦП отличается между основными и расширенными точками доступа? Два изображения: в основных горячих точках - это то, что я ожидал (при использовании 400%, "4" ядра используются потоками). В расширенных точках доступа (даже не на 1…
15 дек '17 в 18:12
0 ответов

Невозможно найти символы отладки и большую нагрузку на процессор

Я новичок в VTune Amplifier и пытаюсь профилировать OpenCV с очень простым приложением. Следуя этому руководству по рекомендуемым параметрам компилятора, я скомпилировал OpenCV через CMake с CMAKE_BUILD_TYPE=RelWithDebInfo а также -DWITH_OPENMP=ON т…
1 ответ

Vtune профилировщик для Adobe Flash Player

Я нашел эту ссылку, которая объясняет, как профилировать приложение Tamarin с помощью vtune. Так как тамарин и Adobe Flash используют одну и ту же базу кода, могу ли я использовать ее для профилирования приложений Flash?
28 ноя '11 в 11:51
0 ответов

Командная очередь OpenCL для процессоров Intel VTune

Я могу просматривать Командную очередь Intel HD Graphics с VTune, но не могу Очередь команд CPU. Зачем? Это ожидаемое поведение - захватывать только "события" GPU, но не те из CPU, которые не зависят от GPU? Та же самая программа OpenCL (простое век…
13 дек '17 в 16:28
0 ответов

MPI4py профилирование с VTune

У меня есть приложение MPI Python, и я пытаюсь профилировать его с помощью VTune. Поскольку я запускаю свое приложение на HPC, я обязан использовать терминал. Я пытался несколько раз, и я получаю следующую ошибку: ampxe: Ошибка: не удалось подключит…
28 сен '17 в 04:22
0 ответов

Использование Vtune для профилирования функции malloc

Я использую усилитель vtune 2018 для профилирования _int_malloc в malloc.c. Однако после получения расширенных результатов в "горячих точках", когда я хочу открыть функцию и просмотреть подробную информацию о горячей точке "_int_malloc", vtune жалуе…
05 дек '17 в 00:16
1 ответ

Как мне интерпретировать эти результаты VTune?

Я пытаюсь распараллелить этот код с помощью OpenMP. OpenCV (построенный с использованием IPP для лучшей эффективности) используется в качестве внешней библиотеки. У меня проблемы с несбалансированным использованием процессора в parallel for с, но ка…
08 май '17 в 09:40
1 ответ

-g флаг изменяет время выполнения и компиляцию программы

Я пишу программу, которая пытается ускорить фильтрацию Top K, используя инструкции SSE и AVX SIMD. Я компилирую свою программу, используя icc с флагами -o3, -msse3 и -lrt, и время выполнения составляет ~30 мс. Однако, когда я ставлю флаг -g в конце,…
22 май '14 в 13:43
1 ответ

Intel Vtune: драйвер питания недоступен

Я пытаюсь запустить анализ мощности Intel vtune на процессоре Intel® Core iM- i7-3632QM под управлением Ubuntu 13.04. Я продолжаю получать сообщение "Драйвер питания недоступен. Убедитесь, что драйвер установлен и у вас есть разрешение на доступ к н…
27 янв '14 в 01:27
0 ответов

Понимание результатов Intel VTune - наивные вопросы

Мое приложение, которое я хочу ускорить, выполняет поэлементную обработку большого массива (около 1e8 элементов). Процедура обработки для каждого элемента очень проста, и я подозреваю, что узким местом может быть не процессор, а пропускная способнос…
04 ноя '16 в 17:04
1 ответ

system_call_after_swapgs, где мой код проводит большую часть времени?

Я пытаюсь профилировать свой код с помощью Intel Vtune. Если посмотреть на стек вызовов функций, то похоже, что большая часть времени уходит на функцию, вызываемую system_call_after_swapgs, Однако информации о стеке нет. Мой вопрос: что такое system…
21 мар '18 в 09:34
1 ответ

Профилирование приложения OpenCL в Windows с графическим процессором NVIDIA

Вы не могли бы мне помочь? Я занимаюсь разработкой приложения OpenCL на Windows 7 x64. Аппаратное обеспечение - Intel Core i5, NVIDIA GTX 770. OpenCL использует NVIDIA для ускорения. Если я пытаюсь использовать Intel VTune Amplifier XE 2015, мое при…
10 авг '16 в 11:40
1 ответ

Сборка OpenCV в режиме отладки с оптимизацией?

Я пытаюсь профилировать OpenCV с помощью Intel VTune Amplifier. На этой странице приведен список параметров компилятора, предложенных для получения наилучшего анализа. Как видите, это сочетание флагов отладки (например, -g) и флаги оптимизации (напр…
04 фев '17 в 12:34
6 ответов

С помощью сборки C/Intel, какой самый быстрый способ проверить, содержит ли 128-байтовый блок памяти все нули?

Продолжая свой первый вопрос, я пытаюсь оптимизировать горячую точку памяти, найденную через VTune, для профилирования 64-битной программы на Си. В частности, я хотел бы найти самый быстрый способ проверить, содержит ли 128-байтовый блок памяти все …
02 мар '13 в 07:43
1 ответ

Влияние развертывания цикла на данные, связанные с памятью

Я работал с частью кода, которая интенсивно связана с памятью. Я пытаюсь оптимизировать его в одном ядре, вручную внедрив блокировку кэша, предварительную загрузку sw, развертывание цикла и т. Д. Несмотря на то, что блокировка кэша дает значительное…
13 июн '12 в 01:36
2 ответа

Можно ли использовать vtune для определенных фрагментов кода в двоичном коде, а не во всем двоичном?

Я добавляю использование небольшой библиотеки к большому существующему программному обеспечению и хотел бы проанализировать (более детально, чем просто вызовы & rdtsc() или gettimeofday) накладные расходы и их атрибуцию небольшой библиотеки. Использ…
31 июл '12 в 23:03