Как получить пропускную способность памяти от тактовой частоты памяти / скорости памяти

К вашему сведению, вот характеристики, которые я получил от Nvidia

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications

Обратите внимание, что скорость памяти / часы памяти на веб-сайте одинаковы и измеряются в Гбит / с.

Спасибо!

3 ответа

Решение

Титан имеет 384-битную шину, в то время как GTX 680 имеет только 256, следовательно, на 50% больше пропускной способности памяти (при условии, что тактовая частота и задержки идентичны.

Изменить: я постараюсь объяснить всю концепцию немного подробнее: ниже приведена упрощенная модель факторов, которые определяют производительность оперативной памяти (не только на видеокартах).

Фактор А: частота

Оперативная память работает на тактовой частоте. Оперативная память с частотой 1 ГГц "тикает" 1 000 000 000 (миллиард) раз в секунду. С каждым тактом он может получать или отправлять один бит на каждой линии. Таким образом, теоретический модуль ОЗУ с одной полосой памяти, работающей на частоте 1 ГГц, будет выдавать 1 гигабит в секунду, поскольку в байтах содержится 8 бит, что означает 125 мегабайт в секунду.

Фактор B: "Скорость насоса"

DDR-RAM (удвоенная скорость передачи данных) может выдавать два бита на такт, и даже есть шины с "четверной накачкой", которые обеспечивают четыре бита на такт, но я не слышал, чтобы последний использовался на видеокартах.

Фактор C: Ширина шины.

RAM не просто имеет одну полосу для отправки данных. Даже у Intel 4004 была 4-х битная шина. Видеокарты, которые вы подключили, имеют 256 линий шины и 384 полосы шины соответственно.

Все вышеперечисленные факторы умножаются для расчета теоретического максимума, при котором данные могут быть отправлены или получены:

** Максимальная пропускная способность в байтах в секунду = частота * Pumprate * BusWidth / 8 **

Теперь давайте посчитаем две видеокарты, которые вы связали. Кажется, что они оба используют один и тот же тип ОЗУ (GDDR5 с частотой накачки 2), обе работают на частоте 3 ГГц.

GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s

GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s

Фактор D: задержка - или реальность

Этот фактор гораздо сложнее рассчитать, чем все вышеперечисленное вместе взятые. По сути, когда вы говорите своей оперативной памяти "эй, я хочу эти данные", требуется время, пока не будет получен ответ. Эта задержка зависит от многих факторов, и ее действительно сложно рассчитать, и обычно это приводит к тому, что системы ОЗУ дают намного меньше своих теоретических максимумов. Это где все время, предварительная выборка и множество других вещей входит в картину. Поскольку для маркетинга могут использоваться не только цифры, а более высокие цифры переводятся в "лучшие", маркетинговый акцент в основном делается на других вещах. И, если вам интересно, именно в этом GDDR5 отличается от DDR3, установленного на материнской плате.

С https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/:

(memory clock in Hz × bus width ÷ 8) × memory clock type multiplier = Пропускная способность в МБ / с

где memory clock type multiplier является одним из следующих:

HBM1 / HBM2: 2
GDDR3: 2
GDDR5: 4
GDDR5X: 8

Давайте возьмем одну из самых современных видеокарт на момент написания этой статьи - GTX 1080 Ti, которая использует память GDDR5X. По данным techPowerUp!, спецификации этой карты:

Часы памяти: 1376 МГц
Ширина шины: 352 бит
Тип памяти: GDDR5X

Если мы вставим эти значения в приведенную выше формулу, мы получим:

(1376 * 352/8) * 8 = 484 352 МБ / с = ~484 ГБ / с

Аналогично для GTX 1070, который использует более старую память GDDR5:

Часы памяти: 2002 МГц
Ширина шины: 256 бит
Тип памяти: GDDR5

(2002 * 256/8) * 4 = 256 256 МБ / с = ~256 ГБ / с

Наконец, для AMD Fury X, которая использует HBM1:

Часы памяти: 500 МГц
Ширина шины: 4096 бит
Тип памяти: HBM1

(500 * 4096/8) * 2 = 512 000 МБ / с = 512 ГБ / с

и Vega 64, которая использует HBM2:

Часы памяти: 945 МГц
Ширина шины: 2048 бит
Тип памяти: HBM2

(945 * 2048/8) * 2 = 483 840 МБ / с = ~484 ГБ / с

Я думаю, что правильный расчет объясняется здесь:
https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

Короче:
"(Часы памяти x Ширина шины / 8) * Множитель типа GDDR = Пропускная способность в ГБ / с

Множитель типа GDDR равен 2 для GDDR3, 4 для GDDR5."

Там есть еще много деталей, достаточно хорошо объясненных и подробных.

Другие вопросы по тегам