Размер AMD Wavefront и конфликты банков

Архитектура GCN имеет волновой фронт размером 64, но в локальной памяти всего 32 банка.

  • Как можно избежать конфликтов, если все потоки должны писать, очевидно, только 32 из 64 могут сделать это, не вызывая конфликта, что я пропускаю?
  • Как ds_permute_b32 и ds_bpermute_b32 вызывают конфликты банков (по всей видимости, они есть) и как этого избежать при передаче данных между потоками в одном волновом фронте?

0 ответов

Другие вопросы по тегам