Какова семантика для буферов Super Queue и Line Fill?

Я задаю этот вопрос относительно Haswell Microarchitetcure(процессор Intel Xeon E5-2640-v3). Из спецификаций процессора и других ресурсов я узнал, что существует 10 LFB, а размер супер-очереди равен 16. У меня есть два вопроса, связанных с LFB и SuperQueues:

1) Какой будет максимальная степень параллелизма на уровне памяти, которую система может обеспечить, 10 или 16(LFB или SQ)?

2) Согласно некоторым источникам, каждый промах L1D записывается в SQ, а затем SQ назначает буфер заполнения строки, а в некоторых других источниках они пишут, что SQ и LFB могут работать независимо. Не могли бы вы вкратце объяснить работу SQ?

Вот примерный рисунок (не для Haswell) для SQ и LFB. введите описание изображения здесь Ссылки: https://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-optimization-manual.pdf

http://www.realworldtech.com/haswell-cpu/

1 ответ

Для (1) логически максимальный параллелизм будет ограничен наименее параллельной частью конвейера, которая представляет собой 10 LFB, и это, вероятно, строго верно для параллелизма нагрузки-нагрузки, когда предварительная выборка отключена или не может помочь. На практике все становится намного сложнее, когда вашей загрузке хотя бы частично помогает предварительная выборка, поскольку тогда можно использовать более широкие очереди между L2 и RAM, что может сделать наблюдаемый параллелизм больше 10. Наиболее практичным подходом, вероятно, является прямое измерение: Измеряя задержку в ОЗУ и наблюдаемую пропускную способность, можно рассчитать эффективный параллелизм для любой конкретной нагрузки.

Для (2) я понимаю, что все наоборот: все пропущенные требования в L1 сначала распределяются в LFB (если, конечно, они не попадают в существующий LFB) и могут позже включать "супер-очередь" (или как там это называется дней), если они также пропустили выше в иерархии кеша. Диаграмма, которую вы включили, кажется, подтверждает, что: единственный путь от L1 - через очередь LFB.

Другие вопросы по тегам