Размер AMD Wavefront и конфликты банков
Архитектура GCN имеет волновой фронт размером 64, но в локальной памяти всего 32 банка.
- Как можно избежать конфликтов, если все потоки должны писать, очевидно, только 32 из 64 могут сделать это, не вызывая конфликта, что я пропускаю?
- Как
ds_permute_b32
иds_bpermute_b32
вызывают конфликты банков (по всей видимости, они есть) и как этого избежать при передаче данных между потоками в одном волновом фронте?