Описание тега superscalar
1
ответ
Какие соображения относятся к прогнозированию задержки для операций на современных суперскалярных процессорах и как я могу рассчитать их вручную?
Я хочу иметь возможность вручную предсказать, сколько именно произвольная арифметическая (то есть без разветвления или памяти, хотя это было бы неплохо), код сборки x86-64 будет принимать для конкретной архитектуры, принимая во внимание переупорядоч…
31 июл '18 в 07:08
2
ответа
Интерпретация абсурдно-низкой измеренной латентности в тщательном профиле (эффекты суперскалярности?)
Я написал некоторый код для профилирования небольших функций. На высоком уровне это: Устанавливает привязку потока только к одному ядру и приоритет потока к максимуму. Вычисляет статистику от выполнения следующих 100 раз: Оцените задержку функции, к…
02 мар '19 в 00:18
0
ответов
Почему проблемы с именами (WaR, WaW) в архитектурах ILP проблематичны?
Предположим, что следующие две инструкции выполняются одновременно: addi $t0, $t1, 4 addi $t1, $t2, 4 Это анти-зависимость или запись после чтения. Предполагая, что они выполняются в одно и то же время, первая инструкция все равно не прочитает прави…
03 апр '18 в 18:54
0
ответов
Шестиступенчатая конвейеризация с суперскалярным процессором с двумя исполнительными блоками
Нужна помощь в проектировании шестиступенчатой конвейеризации с суперскалярным процессором с двумя исполнительными блоками. Шесть этапов - инструкция Fetch (IF), Инструкция декодирования (ID), Читать из регистров (RR), 2-х тактное исполнение (EX),…
13 май '18 в 04:33
1
ответ
Супер-масштабирование против производительности трубопроводов
В то время как суперскалярный процессор обычно также является конвейерным. Почему конвейерная обработка и суперскалярное выполнение считаются различными методами повышения производительности??
26 фев '18 в 01:57
1
ответ
Гиперпоточность и суперскалярное исполнение
Представьте себе процессор (или ядро), который является суперскалярным (несколько исполнительных блоков), а также имеет поддержку гиперпоточности (SMT). Почему количество программных потоков, которые ЦП может действительно выполнять параллельно, обы…
11 апр '19 в 15:48
0
ответов
Почему широко используется суперскаляр шириной 4, даже если его средний IPC в среднем равен 1?
В классе наш профессор показывал нам вопросы из учебника, и один из них был следующим: "Четырехкратные суперскалярные процессоры пытаются исключить четыре инструкции за цикл из буфера переупорядочения. Тем не менее, они редко поддерживают пропускную…
11 окт '19 в 22:54
0
ответов
Нечетный стиль для параллелизма инструкций
final long s0 = this.s0; long s1 = this.s1; final long result = s0 + s1; s1 ^= s0; this.s0 = Long.rotateLeft(s0, 24) ^ s1 ^ s1 << 16; this.s1 = Long.rotateLeft(s1, 37); return result; Разрывает ли копирование полей в стек зависимость от други…
04 окт '21 в 08:34
1
ответ
Отношение между CPI и количеством исполнительных устройств при взгляде на встроенные функции SIMD
Я понимаю, что термин « цикл на инструкцию» тесно связан с суперскалярностью процессора, термин, который я не полностью понял. Согласно Википедии, «... суперскалярный процессор может выполнять более одной инструкции в течение тактового цикла, одновр…
09 фев '23 в 11:25
1
ответ
Синхронизация сборки ARM Cortex-M7 на простом контуре задержки — как объяснить результаты?
Поскольку время цикла AFAIK не публикуется, я решил попытаться измерить количество циклов с помощью счетчика DWT на STM32H750-DK; в качестве первого примера я измеряю простую петлю задержки. Похоже, Cortex-M7 может выполнять две инструкции в каждом …
23 ноя '22 в 17:10
1
ответ
Могут ли современные процессоры x86 идеально выполнять внеочередное выполнение?
Моя мысленная модель выполнения вне очереди состоит в том, чтобы думать об этом как о скользящем окне в потоке команд, где, если в окне есть какие-либо готовые инструкции (их входные данные уже вычислены), их можно запустить немедленно, даже если пе…
16 ноя '23 в 20:57