Есть ли связь между одинарной и двойной точностью в NVIDIA Tesla?

В модели Tesla K20 максимальная производительность с плавающей запятой одинарной точности составляет около 3,52 TFlops, но двойная точность равна 1,17 TFlops, поэтому соотношение равно 3. Tesla K20X имеет 3,95 и 1,31, а Tesla K40 имеет 4,29 и 1,43 TFlops, соотношение, кажется, повторяется. Мой вопрос: есть ли причина для отношения 3, а не 2, что мне кажется логичным, потому что разница между одинарной и двойной точностью. Я изучаю GPUS и GPGPUS, поэтому я не очень много знаю об этом.

На второй странице этого PDF-файла есть таблица спецификаций. http://www.nvidia.com/content/tesla/pdf/NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

1 ответ

Решение

Все перечисленные вами модели основаны на архитектуре Kepler, которая имеет максимальный коэффициент двойной точности, равный 1/3 максимального значения одинарной точности. Именно так NVIDIA создала это оборудование. Для сравнения, Fermi, который является предыдущим поколением аппаратных средств, имел соотношение 1/2 между пиком двойной и одинарной степенью точности.

Вы можете обратиться к документации NVIDIA по пропускной способности команд по типам команд и аппаратному обеспечению:

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html

Вы заметите, что продукты потребительского уровня (GeForce GTX), как правило, имеют гораздо более низкую точность в два раза - одну - 1/8, 1/12, 1/24 и даже 1/32, в зависимости от версии оборудования.

Другие вопросы по тегам