Выполняют ли современные графические процессоры nVIDIA субарповое планирование работы?
В современных архитектурах графических процессоров nVIDIA один потоковый мультипроцессор, похоже, разбит на 4 блока; причем каждый из них имеет горизонтальные или вертикальные "столбики" из 8 "квадратов", соответствующие различным функциональным единицам: целочисленные операции, 32-разрядные операции, 64-разрядные операции и загрузка / сохранение. Кажется, с каждым таким "четверть-SM" связан один планировщик деформации.
Теперь, в модели программирования CUDA, потоки каждого деформирования (= 32 потока) блокируются инструкцией вместе. Однако при фактическом выполнении работы и в ситуации, когда, скажем, активна только вторая половина или последняя четверть потоков в деформации - могут ли эти субэкраны быть запланированы для 2 или 3 четверти SM, а для другой четверти -СМ делает какую-то другую работу?
1 ответ
Нет, они не
Основываясь на комментариях Роберта, планирование суб-деформации не происходит - планирование всегда происходит с полным деформированием (по крайней мере, в отношении любого, кто использует чип). Внутренне это может или не может быть случаем, что планирование суб-основы возможно.