Описание тега superscalar

1 ответ

Какие соображения относятся к прогнозированию задержки для операций на современных суперскалярных процессорах и как я могу рассчитать их вручную?

Я хочу иметь возможность вручную предсказать, сколько именно произвольная арифметическая (то есть без разветвления или памяти, хотя это было бы неплохо), код сборки x86-64 будет принимать для конкретной архитектуры, принимая во внимание переупорядоч…
31 июл '18 в 07:08
2 ответа

Интерпретация абсурдно-низкой измеренной латентности в тщательном профиле (эффекты суперскалярности?)

Я написал некоторый код для профилирования небольших функций. На высоком уровне это: Устанавливает привязку потока только к одному ядру и приоритет потока к максимуму. Вычисляет статистику от выполнения следующих 100 раз: Оцените задержку функции, к…
0 ответов

Почему проблемы с именами (WaR, WaW) в архитектурах ILP проблематичны?

Предположим, что следующие две инструкции выполняются одновременно: addi $t0, $t1, 4 addi $t1, $t2, 4 Это анти-зависимость или запись после чтения. Предполагая, что они выполняются в одно и то же время, первая инструкция все равно не прочитает прави…
0 ответов

Шестиступенчатая конвейеризация с суперскалярным процессором с двумя исполнительными блоками

Нужна помощь в проектировании шестиступенчатой ​​конвейеризации с суперскалярным процессором с двумя исполнительными блоками. Шесть этапов - инструкция Fetch (IF), Инструкция декодирования (ID), Читать из регистров (RR), 2-х тактное исполнение (EX),…
13 май '18 в 04:33
1 ответ

Супер-масштабирование против производительности трубопроводов

В то время как суперскалярный процессор обычно также является конвейерным. Почему конвейерная обработка и суперскалярное выполнение считаются различными методами повышения производительности??
26 фев '18 в 01:57
1 ответ

Гиперпоточность и суперскалярное исполнение

Представьте себе процессор (или ядро), который является суперскалярным (несколько исполнительных блоков), а также имеет поддержку гиперпоточности (SMT). Почему количество программных потоков, которые ЦП может действительно выполнять параллельно, обы…
11 апр '19 в 15:48
0 ответов

Почему широко используется суперскаляр шириной 4, даже если его средний IPC в среднем равен 1?

В классе наш профессор показывал нам вопросы из учебника, и один из них был следующим: "Четырехкратные суперскалярные процессоры пытаются исключить четыре инструкции за цикл из буфера переупорядочения. Тем не менее, они редко поддерживают пропускную…
11 окт '19 в 22:54
0 ответов

Нечетный стиль для параллелизма инструкций

final long s0 = this.s0; long s1 = this.s1; final long result = s0 + s1; s1 ^= s0; this.s0 = Long.rotateLeft(s0, 24) ^ s1 ^ s1 << 16; this.s1 = Long.rotateLeft(s1, 37); return result; Разрывает ли копирование полей в стек зависимость от други…
1 ответ

Отношение между CPI и количеством исполнительных устройств при взгляде на встроенные функции SIMD

Я понимаю, что термин « цикл на инструкцию» тесно связан с суперскалярностью процессора, термин, который я не полностью понял. Согласно Википедии, «... суперскалярный процессор может выполнять более одной инструкции в течение тактового цикла, одновр…
1 ответ

Синхронизация сборки ARM Cortex-M7 на простом контуре задержки — как объяснить результаты?

Поскольку время цикла AFAIK не публикуется, я решил попытаться измерить количество циклов с помощью счетчика DWT на STM32H750-DK; в качестве первого примера я измеряю простую петлю задержки. Похоже, Cortex-M7 может выполнять две инструкции в каждом …
1 ответ

Могут ли современные процессоры x86 идеально выполнять внеочередное выполнение?

Моя мысленная модель выполнения вне очереди состоит в том, чтобы думать об этом как о скользящем окне в потоке команд, где, если в окне есть какие-либо готовые инструкции (их входные данные уже вычислены), их можно запустить немедленно, даже если пе…