Как получить пропускную способность памяти от тактовой частоты памяти / скорости памяти
К вашему сведению, вот характеристики, которые я получил от Nvidia
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications
Обратите внимание, что скорость памяти / часы памяти на веб-сайте одинаковы и измеряются в Гбит / с.
Спасибо!
3 ответа
Титан имеет 384-битную шину, в то время как GTX 680 имеет только 256, следовательно, на 50% больше пропускной способности памяти (при условии, что тактовая частота и задержки идентичны.
Изменить: я постараюсь объяснить всю концепцию немного подробнее: ниже приведена упрощенная модель факторов, которые определяют производительность оперативной памяти (не только на видеокартах).
Фактор А: частота
Оперативная память работает на тактовой частоте. Оперативная память с частотой 1 ГГц "тикает" 1 000 000 000 (миллиард) раз в секунду. С каждым тактом он может получать или отправлять один бит на каждой линии. Таким образом, теоретический модуль ОЗУ с одной полосой памяти, работающей на частоте 1 ГГц, будет выдавать 1 гигабит в секунду, поскольку в байтах содержится 8 бит, что означает 125 мегабайт в секунду.
Фактор B: "Скорость насоса"
DDR-RAM (удвоенная скорость передачи данных) может выдавать два бита на такт, и даже есть шины с "четверной накачкой", которые обеспечивают четыре бита на такт, но я не слышал, чтобы последний использовался на видеокартах.
Фактор C: Ширина шины.
RAM не просто имеет одну полосу для отправки данных. Даже у Intel 4004 была 4-х битная шина. Видеокарты, которые вы подключили, имеют 256 линий шины и 384 полосы шины соответственно.
Все вышеперечисленные факторы умножаются для расчета теоретического максимума, при котором данные могут быть отправлены или получены:
** Максимальная пропускная способность в байтах в секунду = частота * Pumprate * BusWidth / 8 **
Теперь давайте посчитаем две видеокарты, которые вы связали. Кажется, что они оба используют один и тот же тип ОЗУ (GDDR5 с частотой накачки 2), обе работают на частоте 3 ГГц.
GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s
GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s
Фактор D: задержка - или реальность
Этот фактор гораздо сложнее рассчитать, чем все вышеперечисленное вместе взятые. По сути, когда вы говорите своей оперативной памяти "эй, я хочу эти данные", требуется время, пока не будет получен ответ. Эта задержка зависит от многих факторов, и ее действительно сложно рассчитать, и обычно это приводит к тому, что системы ОЗУ дают намного меньше своих теоретических максимумов. Это где все время, предварительная выборка и множество других вещей входит в картину. Поскольку для маркетинга могут использоваться не только цифры, а более высокие цифры переводятся в "лучшие", маркетинговый акцент в основном делается на других вещах. И, если вам интересно, именно в этом GDDR5 отличается от DDR3, установленного на материнской плате.
(memory clock in Hz
× bus width
÷ 8) × memory clock type multiplier
= Пропускная способность в МБ / с
где memory clock type multiplier
является одним из следующих:
HBM1 / HBM2: 2
GDDR3: 2
GDDR5: 4
GDDR5X: 8
Давайте возьмем одну из самых современных видеокарт на момент написания этой статьи - GTX 1080 Ti, которая использует память GDDR5X. По данным techPowerUp!, спецификации этой карты:
Часы памяти: 1376 МГц
Ширина шины: 352 бит
Тип памяти: GDDR5X
Если мы вставим эти значения в приведенную выше формулу, мы получим:
(1376 * 352/8) * 8 = 484 352 МБ / с = ~484 ГБ / с
Аналогично для GTX 1070, который использует более старую память GDDR5:
Часы памяти: 2002 МГц
Ширина шины: 256 бит
Тип памяти: GDDR5
(2002 * 256/8) * 4 = 256 256 МБ / с = ~256 ГБ / с
Наконец, для AMD Fury X, которая использует HBM1:
Часы памяти: 500 МГц
Ширина шины: 4096 бит
Тип памяти: HBM1
(500 * 4096/8) * 2 = 512 000 МБ / с = 512 ГБ / с
и Vega 64, которая использует HBM2:
Часы памяти: 945 МГц
Ширина шины: 2048 бит
Тип памяти: HBM2
(945 * 2048/8) * 2 = 483 840 МБ / с = ~484 ГБ / с
Я думаю, что правильный расчет объясняется здесь:
https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/
Короче:
"(Часы памяти x Ширина шины / 8) * Множитель типа GDDR = Пропускная способность в ГБ / с
Множитель типа GDDR равен 2 для GDDR3, 4 для GDDR5."
Там есть еще много деталей, достаточно хорошо объясненных и подробных.