Тесла двойной точности

Question

Тесла двойной точности

Я ищу информацию о том, как аппаратная реализация двойной точности реализована в Tesla GPU. Я читал, что два потоковых процессора работают над одним двойным значением, но я не нашел никакой официальной статьи от nvidia.

Заранее спасибо. PPS Почему большинство графических процессоров вычисляют только с одной точностью (потому что цвета могут храниться как RR.GG.BB.TT, где каждый символ является 8-битным значением)?

PS гугл это мне не помогло

3

cuda double opencl

Источник

user365656 11 авг '10 в 14:14

3 ответа

Решение

Tesla - это не графический процессор, это линейка сопроцессоров с различными высокопроизводительными графическими процессорами. Если ваш Tesla имеет графический процессор Fermi внутри, он должен иметь хорошую производительность с двойной точностью.

См. Белую книгу Ферми, стр. 9.

Одинарная точность важнее для обычных вычислений на GPU, потому что она достаточна для таких приложений.

2

Источник

user153285 11 авг '10 в 20:07

Согласно вики:

Для двойной точности (поддерживается только в более новых графических процессорах, таких как GTX 260[12]), есть некоторые отклонения от стандарта IEEE 754: округление до ближайшего четного является единственным поддерживаемым режимом округления для взаимного, деления и квадратного корня. При одинарной точности денормали и сигнальные NaN не поддерживаются; поддерживаются только два режима округления IEEE (четность и четность округления до ближайшего), и они указываются для каждой инструкции, а не в контрольном слове; и точность деления / квадратный корень немного ниже, чем одинарная точность.

Итак, они реализуют большую часть спецификации IEEE 754, но фактическая реализация, вероятно, является частной и секретной.

1

Источник

user176769 11 авг '10 в 19:58

Другие вопросы по тегам cuda double opencl

user161331 11 авг '10 в 23:51 2010-08-11 23:51 · Accepted Answer · 2010-08-11 23:51

Отказ от поддержки double - это не вопрос формата хранения, как вы сказали (RR.GG.BB.TT), а наличие встроенных встроенных функций (и, соответственно, выделенного оборудования) для обработки операций над double (add, mul, madd и т. Д.).

В любом случае, большинство графических процессоров поддерживает только одну точность, потому что большая часть рынка графических процессоров находится на игровом рынке, и геймерам не нужна двойная точность. Также большинство игроков ищут хорошее соотношение цена / качество. Реализация DP обходится дорого с точки зрения бюджета транзисторов (и TDP), и если игры не используют двойную точность, это бессмысленно.

Вот почему вы видите высокопроизводительные графические процессоры ATI, поддерживающие двойные (HD 59xx и HD 58xx, но не графические процессоры среднего и начального уровня, такие как HD 57xx и менее).

@karlphillip: Да, вы правы, IEEE754 (вроде) для графических процессоров, таких как GTX 260, но нынешнее поколение ATI и NVIDIA поддерживает IEEE 754-2008 на высококлассных компонентах.

О аппаратной реализации, это секреты, которые обычно не рассказывают IHV:)