Vtune общее время в функции MKL
Я работаю над университетским проектом, в котором меня просят рассказать о некоторых трехдиагональных автоматах, реализованных в MKL (11.1.). Поэтому я реализовал для этого несколько тестовых площадок, и сейчас я пытаюсь профилировать это в vtune (Intel VTune Amplifier XE 2013 Update 16). Мне нужно найти узкие места, то есть в какой части кода (MKL, а не в моей) и в каких функциях, вызываемых eigensolver, я трачу больше всего времени.
Для этого я надеялся получить общее время, потраченное на каждую функцию и ее вызываемых абонентов. Тем не менее, все, что я получаю - это время каждой функции.
Мой код был скомпилирован с помощью icc 14.0/3.174, где я попробовал и то и другое, связывая MKL статически и динамически.
Я надеюсь, что я не пропускаю что-то глупое здесь. Я также очень открыт для других предложений о том, как найти необходимые значения.
1 ответ
Ну, вы должны перейти к представлениям "Caller/Callee" или "Top-Down". Нажмите на "вкладки" в верхней части. Вы найдете больше деталей в документации VTune: