Теоретическая скалярная целочисленная производительность KabyLake
Я проводил несколько экспериментов с Intel Advisor 2020 и, в частности, с моделью линии крыши. Я не могу понять, почему пиковая производительность скалярных целых чисел (intop/cycle) отличается от теоретической, которую я ожидал, тем более что все другие показатели совпадают более или менее (производительность векторных целых чисел, с плавающей запятой...)
В частности, согласно Intel Advisor, максимальная пиковая производительность (для добавления) составляет около 2,3 целочисленных операций за цикл, в то время как теоретическое значение, которое я ожидал бы найти, составляет 4 Intp/ цикл, поскольку у нас есть 4 INT ALU в 4 разных портах.
Я что-то упускаю?