AVX 512 против расчета флопов / циклов без AVX512
Я продолжаю читать, что с AVX512 ядро Intel Skylake с двумя функциональными блоками с плавающей запятой может работать 32 такта / такт в секунду. На том же ядре, если вы не используете инструкции AVX512, вы можете достичь 2 операций в секунду / цикл из-за двух функциональных блоков с плавающей запятой? Или больше?
Спасибо