CUDA: банковские конфликты между разными перекосами?

Я только что узнал (из Почему только один из деформаций выполняется SM в cuda?), Что графические процессоры Kepler могут фактически выполнять инструкции из нескольких (очевидно, 4) деформаций одновременно.

Может ли банк общей памяти обслуживать одновременно четыре запроса? Если нет, это будет означать, что конфликты банков могут возникать между потоками разных деформаций, которые выполняются одновременно, даже если между какими-либо отдельными деформациями нет конфликтов между банками, верно? Есть ли информация по этому поводу?

1 ответ

Возможность вычислений 3.x устройства (Kepler) имеют 4 планировщика перекосов на SM. В каждом цикле каждый планировщик основы выбирает основу и выдает 1-2 инструкции из основы. SM имеет только один модуль хранения нагрузки (LSU), который обслуживает L1 и запросы общей памяти, так что только 1 из 8 потенциальных инструкций может быть отправлено в LSU, чтобы не возникали конфликты банков между перекосами.

Другие вопросы по тегам