Тесла двойной точности
Я ищу информацию о том, как аппаратная реализация двойной точности реализована в Tesla GPU. Я читал, что два потоковых процессора работают над одним двойным значением, но я не нашел никакой официальной статьи от nvidia.
Заранее спасибо. PPS Почему большинство графических процессоров вычисляют только с одной точностью (потому что цвета могут храниться как RR.GG.BB.TT, где каждый символ является 8-битным значением)?
PS гугл это мне не помогло
3 ответа
Отказ от поддержки double - это не вопрос формата хранения, как вы сказали (RR.GG.BB.TT), а наличие встроенных встроенных функций (и, соответственно, выделенного оборудования) для обработки операций над double (add, mul, madd и т. Д.).
В любом случае, большинство графических процессоров поддерживает только одну точность, потому что большая часть рынка графических процессоров находится на игровом рынке, и геймерам не нужна двойная точность. Также большинство игроков ищут хорошее соотношение цена / качество. Реализация DP обходится дорого с точки зрения бюджета транзисторов (и TDP), и если игры не используют двойную точность, это бессмысленно.
Вот почему вы видите высокопроизводительные графические процессоры ATI, поддерживающие двойные (HD 59xx и HD 58xx, но не графические процессоры среднего и начального уровня, такие как HD 57xx и менее).
@karlphillip: Да, вы правы, IEEE754 (вроде) для графических процессоров, таких как GTX 260, но нынешнее поколение ATI и NVIDIA поддерживает IEEE 754-2008 на высококлассных компонентах.
О аппаратной реализации, это секреты, которые обычно не рассказывают IHV:)
Tesla - это не графический процессор, это линейка сопроцессоров с различными высокопроизводительными графическими процессорами. Если ваш Tesla имеет графический процессор Fermi внутри, он должен иметь хорошую производительность с двойной точностью.
См. Белую книгу Ферми, стр. 9.
Одинарная точность важнее для обычных вычислений на GPU, потому что она достаточна для таких приложений.
Согласно вики:
Для двойной точности (поддерживается только в более новых графических процессорах, таких как GTX 260[12]), есть некоторые отклонения от стандарта IEEE 754: округление до ближайшего четного является единственным поддерживаемым режимом округления для взаимного, деления и квадратного корня. При одинарной точности денормали и сигнальные NaN не поддерживаются; поддерживаются только два режима округления IEEE (четность и четность округления до ближайшего), и они указываются для каждой инструкции, а не в контрольном слове; и точность деления / квадратный корень немного ниже, чем одинарная точность.
Итак, они реализуют большую часть спецификации IEEE 754, но фактическая реализация, вероятно, является частной и секретной.