收藏 分享(赏)

SDR,DDR123,GDDR12345_详细规格解释.doc

上传人:11xg27ws 文档编号:9295178 上传时间:2019-08-01 格式:DOC 页数:27 大小:1.37MB
下载 相关 举报
SDR,DDR123,GDDR12345_详细规格解释.doc_第1页
第1页 / 共27页
SDR,DDR123,GDDR12345_详细规格解释.doc_第2页
第2页 / 共27页
SDR,DDR123,GDDR12345_详细规格解释.doc_第3页
第3页 / 共27页
SDR,DDR123,GDDR12345_详细规格解释.doc_第4页
第4页 / 共27页
SDR,DDR123,GDDR12345_详细规格解释.doc_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、SDR,DDR1/2/3,GDDR1/2/3/4/5 详细规格解释(上)超牛的文章(2011-04-04 18:07:40)转载通常大家所说的 DDR-400、DDR2-800、DDR3-1600 等,其实并非是内存的真正频率,而是业界约定俗成的等效频率,这些 DDR1/2/3 内存相当于老牌 SDR内存运行在 400MHz、800MHz、1600MHz 时的带宽,因此频率看上去很夸张,其实真正的内核频率都只有 200MHz而已!内存有三种不同的频率指标,它们分别是核心频率、时钟频率和有效数据传输频率。核心频率即为内存 Cell阵列(Memory Cell Array,即内部电容)的刷新频率,

2、它是内存的真实运行频率;时钟频率即 I/O Buffer(输入/输出缓冲)的传输频率;而有效数据传输频率就是指数据传送的频率(即等效频率)。 SDR 和 DDR1/2/3全系列频率对照表:常见 DDR内存频率对照表通过上表就能非常直观的看出,近年来内存的频率虽然在成倍增长,可实际上真正存储单元的频率一直在 133MHz-200MHz之间徘徊,这是因为电容的刷 新频率受制于制造工艺而很难取得突破。而每一代 DDR的推出,都能够以较低的存储单元频率,实现更大的带宽,并且为将来频率和带宽的提升留下了一定的空 间。 SDR 和 DDR1/2/3存储原理示意图:虽然存储单元的频率一直都没变,但内存颗粒的

3、 I/O频率却一直在增长,再加上 DDR是双倍数据传输,因此内存的数据传输率可以达到核心频率的 8倍之多!通过下面的示意图就能略知一二:那么,内存 IO频率为什么能达到数倍于核心频率呢?相信很多人都知道,DDR1/2/3 内存最关键的技术就是分别采用了 2/4/8bit数据预取技术(Prefetch),由此得以将带宽翻倍,与此同时 I/O控制器也必须做相应的改进。内存数据预取技术示意图:并行转串行这种存储阵列内部的实际位宽较大,但是数据输出位宽却比较小的设计,就是所谓的数据预取技术,它可以让内存的数据传输频率倍增。试想如果我们把一条细水管安装在粗水管之上,那么水流的喷射速度就会翻几倍。明白了数

4、据预取技术的原理之后,再来看看 DDR1/2/3内存的定义,以及三种频率之间的关系,就豁然开朗了: SDRAM(Synchronous DRAM):同步动态随机存储器之所以被称为“同步”,因为 SDR内存的存储单元频率、I/O 频率及数据传输率都是相同的,比如经典的 PC133,三种频率都是 133MHz。SDR在一个时钟周期内只能读/写一次,只在时钟上升期读/写数据,当同时需要读取和写入时,就得等待其中一个动作完成之后才能继续进行下一个动作。 DDR(Double Date Rate SDRAM):双倍速率同步动态随机存储器双倍是指在一个时钟周期内传输两次数据,在时钟的上升期和下降期各传输一

5、次数据(通过差分时钟技术实现),在存储阵列频率不变的情况下,数据传输率达到了 SDR的两倍,此时就需要 I/O从存储阵列中预取 2bit数据,因此I/O的工作频率是存储阵列频率的两倍。DQ频率和 I/O频率是相同的,因为 DQ在时钟上升和下降研能传输两次数据,也是两倍于存储阵列的频率。 DDR2(DDR 2 SDRAM):第二代双倍速率同步动态随机存储器DDR2在 DDR1的基础上,数据预取位数从 2bit扩充至 4bit,此时上下行同时传输数据(双倍)已经满足不了 4bit预取的要求,因此 I/O控制器频率必须加倍。至此,在存储单元频率保持 133-200MHz不变的情况下,DDR2 的实际

6、频率达到了 266-400MHz,而(等效)数据传输率达到了 533-800MHz。 DDR3(DDR 3 SDRAM):第三代双倍速率同步动态随机存储器DDR3就更容易理解了,数据预取位数再次翻倍到 8bit,同理 I/O控制器频率也加倍。此时,在存储单元频率保持 133-200MHz不变的情况下,DDR3 的实际频率达到了 533-800MHz,而(等效)数据传输率高达 1066-1600MHz。综上可以看出,DDR1/2/3 的发展是围绕着数据预取而进行的,同时也给I/O控制器造成了不小的压力,虽然存储单元的工作频率保持不变,但 I/O频率以级数增长,我们可以看到 DDR3的 I/O频率

7、已逼近 1GHz大关,此时 I/O频率成为了新的瓶颈,如果继续推出 DDR4(注意不是 GDDR4,两者完全不是同一概念,后文会有详细解释)的话,将会受到很多未知因素的制约,必须等待更先进的工艺或者新解决方案的出现才有可能延续 DDR的生命。 内存位宽SDR/DDR1/2/3 单条内存都是 64bit内存模组的设计取决于内存控制器(集成在北桥或者 CPU内部),理论上位宽可以无限提升,但受制因素较多:高位宽将会让芯片组变得十分复杂,对主板布线提 出严格要求,内存 PCB更是丝毫马虎不得,内存颗粒及芯片设计也必须作相应的调整。可谓是牵一发而动全身,所以多年来业界都是墨守成规,维持 64bit的

8、设计不变。相比之下,显卡作为一个整体就没有那么多的顾忌,只需重新设计 GPU内部的显存控制器,然后 PCB按照位宽要求布线,焊更多的显存颗粒上去就行了,虽然成本也很高但实现 512bit并没有太大难度。 多通道内存双通道/三通道既然实现高位宽内存条太难,那么就退而求其次,让两条内存并行传输数据,同样可以让位宽翻倍。目前流行的双通道技术就是如此,北桥或者 CPU内部整合了两个独立的 64bit内存控制器,同时传输数据等效位宽就相当于128bit。Intel Nehalem核心 CPU直接整合三通道内存控制器,位宽高达 192bit。但由于 CPU、主板、内存方面成本都增加不少,因此在主流 Lyn

9、nfield 核心CPU上面又回归了双通道设计。事实上服务器芯片组已经能够支持四通道内存,对服务器来说成本方面不是问题,只是对稳定性和容错性要求很高。 内存颗粒位宽:4/8/16/32bit理论上,完全可以制造出一颗位宽为 64bit的芯片来满足一条内存使用,但这种设计对技术要求很高,良品率很低导致成本无法控制,应用范围很窄。所以内存芯片的位宽一般都很小,台式机内存颗粒的位宽最高仅 16bit,常见的则是 4/8bit。这样为了组成 64bit内存的需要,至少需要 4颗 16bit的芯片、8 颗 8bit的芯片或者 16颗 4bit的芯片。而显卡对位宽要求很高,容量反而退居其次,所以显存颗粒的

10、位宽普遍比内存颗粒大(这就是显存和内存主要区别之一),比如 GDDR3/4/5颗粒都是 32bit,4 颗就能满足低端卡 128bit的需要,8 颗可以满足高端卡 256bit的需要;而低端 GDDR2颗粒为 16bit,需要 8颗才能组成低端卡 128bit 的需要。 内存芯片的逻辑 Bank在芯片的内部,内存的数据是以 bit为单位写入一张大的矩阵中,每个单元称为 CELL阵列,只要指定一个行一个列,就可以准确地定位到某个 CELL,这就是内存芯片寻址的基本原理。这个阵列我们就称为内存芯片的 BANK,也称之为逻辑 BANK(Logical BANK)。不可能只做一个全容量的逻辑 Bank

11、,因为单一的逻辑 Bank将会造成非常严重的寻址冲突,大幅降低内存效率。所以大容量内存颗粒都是由多个逻辑Bank叠加而成的。简单来说,我们可以把一个 Bank看作是一片平面的矩阵纸,而内存颗粒是由多片这样的纸叠起来的。一个 Bank的位宽就是内存颗粒的位宽,内存控制器一次只允许对一个Bank进行操作,由于逻辑 Bank的地址线是公用的,所以在读写时需要加一个逻辑 Bank的编号,这个动作被称为片选。 内存条的物理 Bank内存控制器的位宽必须与内存条的位宽相等,这样才能在一个时钟周期内传输所有数据,这个位宽就被成为一个物理 Bank(通常是 64bit),每条内存至少包含一个 Bank,多数情

12、况下拥有二个物理 Bank。一个物理 Bank不会造成带宽浪费,理论上是最合理的配置,但为了实现大容量内存,单条内存多物理 Bank也是允许的,但内存控制器所能允许的最大 Bank数存在上限,常见的是双物理 Bank设计,只有特殊内存或者服务器内存才会使用四 Bank以上的设计,因为这种内存兼容性不好,“挑”芯片组。事实上显卡上也存在双物理 Bank设计,目的就是为了实现超大显存容量,比如 1GB的 9800GT,正反两面共有 16颗 16M32bit的 GDDR3显存,总位宽达512bit,实际上显存控制器只支持 256bit,这样就是双物理 Bank。SDRAM时代,显存颗粒和内存颗粒通用

13、早在 SDRAM时代,显卡上用的“显存颗粒”与内存条上的“内存颗粒”是完全相同的。在那个时候,GPU 本身的运算能力有限,对数据带宽的要求自然也不高,所以高频的 SDRAM颗粒就可以满足要求。 内存满足不了显卡的需求,显存应运而生本是同根生的状况一直持续到 SDR和 DDR交接的时代,其实最早用在显卡上的 DDR颗粒与用在内存上的 DDR颗粒仍然是一样的。后来由于 GPU特殊的需要,显存颗粒与内存颗粒开始分道扬镳,这其中包括了几方面的因素:1. GPU需要比 CPU更高的带宽。GPU 不像 CPU那样有大容量二三级缓存,GPU与显存之间的数据交换远比 CPU频繁,而且大多都是突发性的数据流,因

14、此 GPU比 CPU更加渴望得到更高的显存带宽支持。位宽频率=带宽,因此提高带宽的方法就是增加位宽和提高频率,但 GPU对于位宽和频率的需求还有其它的因素。2显卡需要高位宽的显存。显卡 PCB空间是有限的,在有限的空间内如何合理的安排显存颗粒,无论高中低端显卡都面临这个问题。从布线、成本、性能等多种角度来看,显存都需要达到更高的位宽。最早的显存是单颗 16bit的芯片,后来升级到 32bit,将来甚至还会有更高的规格出现。而内存则没有那么多要求,多年来内存条都是 64bit,所以单颗内存颗粒没必要设计成高位宽,只要提高容量就行了,所以位宽一直维持在4/8bit。3显卡能让显存达到更高的频率。显

15、存颗粒与 GPU配套使用时,一般都经过专门的设计和优化,而不像内存那样有太多顾忌。GPU 的显存控制器比 CPU或北 桥内存控制器性能优异,而且显卡 PCB可以随意的进行优化,因此显存一般都能达到更高的频率。而内存受到内存 PCB、主板走线、北桥 CPU得诸多因素的限 制很难冲击高频率由此算来,显存与内存“分家”既是意料之外,又是情理之中的事情了。为了更好地满足显卡 GPU的特殊要求,一些厂商(如三星等)推出了专门为图形系统设计的高速 DDR显存,称为“Graphics Double Data Rate DRAM”,也就是我们现在常见的 GDDR。 GDDR显存和内存正式分家GDDR作为第一代

16、专用的显存芯片,其实在技术方面与 DDR没有任何区别,同样采用了 2bit预取技术,理论频率 GDDR并不比 DDR高多少。不过后期改进工艺的 GDDR有了优秀 PCB的显卡支持之后,GDDR 显存最高冲刺至 900MHz,而DDR内存只能达到 600MHz左右,显存和内存的差距从此逐渐 拉开。TSOP封装的 GDDR 16bit:TSOP II封装的 GDDR,单颗 16MB,理论频率 500MHz当年 9550、FX5700 等 128Bit中端卡需要搭配 8颗才能组成 128Bit TSOP封装的 GDDR颗粒,外观规格特性都与 DDR内存颗粒没有什么区别,所以在很多人看来“GDDR”与

17、“DDR”是可以“划等号”的。其实两者还是有些差别:GDDR采用 4K循环 32ms的刷新周期,而 DDR采用 8K循环 64ms的刷新周期;GDDR为了追求频率在延迟方面放的更宽一些,毕竟 GPU对延迟不太敏感;GDDR颗粒的容量小、位宽大,一般是 816Bit(16MB)的规格,而 DDR颗粒的容量大、位宽小,虽然也有 16Bit的颗粒,但最常见的还是 8Bit和 4Bit,单颗容量 32MB或 64MB。为了实现更大的位宽,并进一步提升 GDDR的性能,后期很多厂商改用了电气性能更好的 MBGA封装,当然也有内存颗粒使用 MBGA封装,但规格已有了较大差异,主要是颗粒位宽不同。MBGA封

18、装的 GDDR 32bit:4M32Bit 2.2ns MBGA封装的 GDDR,单颗 16MB,理论频率 900MHz8颗组成 128MB 256Bit规格,是 GDDR1最后的辉煌MBGA封装 GDDR的单颗位宽首次达到了 32Bit,从此就标志着 GDDR与 DDR正式分道扬镳,32Bit 的规格被 GDDR2/3/4/5一直沿用至今。GDDR显存的这两种封装:MBGA 与 TSOP构成的高低配,曾一度一统显卡市场。虽然 GDDR已经退出历史舞台,但 32Bit主攻中高端、16Bit 主攻低端的局面,时至今日依然得到了延续。 GDDR2 第一版:短命的早产儿 高压高发热GDDR2源于 D

19、DR2技术,也就是采用了 4Bit预取,相比 DDR1代可以将频率翻倍。虽然技术原理相同,但 GDDR2要比 DDR2早了将近两年时间, 首次支持DDR2内存的 915P主板于 2004年中发布,而首次搭载 GDDR2显存的FX5800Ultra于 2003年初发布,但早产儿往往是短命的。NVIDIA在设计 NV30芯片时依然保持 128Bit显存位宽,为了提高带宽必须使用高频显存,700MHz 的 GDDR已经无法满足需求了,于是冒险尝 试 GDDR2。第一代 GDDR2受制造工艺限制,电压规格还是和 DDR/GDDR一样的 2.5V,虽然勉强将频率提升至 1GHz左右,但功耗发热出奇的大。

20、4M32Bit 2.0ns MBGA 144Ball封装的 GDDR2,单颗 16MB,理论频率 1000MHzGDDR2第一版只有 2.2ns和 2.0ns两种速度GDDR2第一版只在 FX5800/Ultra和 FX5600Ultra这三款显卡上出现过(也包括对应的专业卡及个别非公版显卡),ATI 也有极少数 9800Pro 使用了GDDR2。高电压、高发热、高功耗、高成本给人的印象非常差。随着 FX5900改用 GDDR及 256Bit,GDDR2 很快被人遗 忘。FX5800Ultra需要为显存专门安装厚重的散热片GDDR2失败的主要原因是 NVIDIA GeForce FX系列架构和

21、性能的问题,之后即便改用了 256Bit高频 GDDR(此时 GDDR的频率已被提升至 850-900MHz,直逼 GDDR2),FX5950Ultra 依然不是 9800XT的对手。当然 GDDR2自身规格的不完善也造成了它无法入住中低端显卡,被时代所遗弃。GDDR2虽然坏毛病一大堆,但它也拥有一些新的特性,比如首次使用片内终结电阻,PCB 设计比 GDDR更加简洁,这个特性被后来的 gDDR2和 GDDR3继承。 gDDR2 第二版:统一低端显卡 永远的配角由于第一代 GDDR2的失败,高端显卡的显存是直接从 GDDR跳至 GDDR3的,但 GDDR2并未消亡,而是开始转型。几大 DRAM

22、大厂有针对性的对 GDDR2 的规格和特性做了更改(说白了就是 DDR2的显存版),由此 gDDR2第二版正式登上显卡舞台,时至今日依然活跃在低端显卡之上。gDDR2第二版相对于第一版的改进主要有: 工作电压从 2.5V降至 1.8V,功耗发热大降; 制造工艺有所进步,功耗发热进一步下降,成本降低,同时良率和容量有所提升; 颗粒位宽从 32Bit降至 16Bit,只适合低端显卡使用; 封装形式从 144Ball MBGA改为 84Ball FBGA,外观上来看从正方形变成长方形或者长条形;由于电压的下降,第二代 gDDR2的频率要比第一代 GDDR2低,主要以2.5ns(800MHz)和 2.

23、2ns(900MHz)的规格为主,当然也有 2.8ns(700MHz)的型号。直到后期制造工艺上去之后,第二代 gDDR2才以 1.8V电压突破了 1000MHz,最高可达 1200MHz,赶超了第一代高压 GDDR2的记录。采用 gDDR2显存的经典显卡有:7300GT、7600GS、X1600Pro、8500GT一大堆低端显卡。注意三星官方网站对于显存的分类相信很多朋友也注意到了,本页 gDDR2的第一个字母为小写,几大 DRAM厂商在其官方网站和 PDF中就都是这么写的,以示区分。我们可以这么认为:大写 G表示显卡专用,32bit 定位高端的版本;而小写 g表示为显卡优化,16bit 定

24、位低端的版本,本质上与内存颗粒并无区别。事实上,GDDR3 和 gDDR3之间也是这种关系,稍后我们会做详细介绍。GDDR源于 DDR,GDDR2 源于 DDR2,而 GDDR3在频率方面的表现又与 DDR3比较相似,于是很多人认为 GDDR3就是显存版的 DDR3,这可是个天大的误区。 GDDR3:一代王者 GDDR3源于 DDR2技术无论 GDDR还是 GDDR2,由于在技术方面与 DDR/DDR2并无太大差别,因此最终在频率方面 GDDR并不比 DDR高太多。在经历了 GDDR2的失败 之后,两大图形巨头 NVIDIA和 ATI对 JEDEC组织慢如蜗牛般的标准制订流程感到越来越失望,认

25、为他们制定的显存不能适应 GPU快节奏的产品更新换代周期,于是NVIDIA和 ATI的工作人员积极参与到了 JEDEC组织当中,以加速显存标准的起草及制定。双方一致认为,显存与内存在数据存储的应用方面完全不同,在内存核心频率(电容刷新频率)无法提升的情况下,单纯提高 I/O频率来获得高带宽很不现实。因此,必须要有一种针对高速点对点环境而重新定义的 I/O接口。于是GDDR3诞生了,这是第一款真正完全为 GPU设计的存储器。GDDR3和 GDDR2/DDR2一样,都是 4Bit预取架构,GDDR3 主要针对 GDDR2高功耗高发热的缺点进行改进,并提升传输效率来缓解高延迟的负面影响。点对点 DQ

26、S,读写无需等待GDDR2只有一条数据选择脉冲(DQS),是单一双向的,而 GDDR3则拥有读与写两条独立的 DQS,而且是点对点设计。这样做的好处在于,在读取之后如果马上进行写入时,不必再等 DQS的方向转变,由此实现读写操作的快速切换。相比 GDDR2/DDR2,GDDR3 的读写切换动作可以少一个时钟周期,如果需要对某一个连续的区块同时读写数据时,GDDR3 的速度就要比 GDDR2快一倍。由于存储单元自身的特性,内存颗粒的逻辑 Bank是无法同时读写数据的,并不存在“全双工”一说,但 GDDR3的这项改进让顺序读写成为可能。GPU 本身缓存很小,与显存之间的数据交换极其频繁,读写操作穿

27、插进行,因此GDDR3点对点设计的 DQS可以让显存存储效率大增。但对于 CPU来说,读写切换并不如 GPU那么频繁,而且 CPU拥有大容量的二三级缓存,所以 GDDR3这种设计并不能极大的提升内存带宽,也没有引入到下一代 DDR3当中。 改进 I/O接口,简化数据处理,控制功耗同时 GDDR3也对 I/O控制电路和终结电阻进行了修改,它不再沿用 GDDR2的“推式(Push Pull)”接收器,而将其改为虚拟开极逻辑方式(Pseudo Open Drain Logic),并且通过将所有的三相数据信号转移到本位电路上,来简化数据处理,将 DC电流压至最小,只有当逻辑 LOW移至总线上时才会消费

28、电力,从而很好的控制了功耗和发热。GDDR3的频率能达到现在这么高,其实并没有什么诀窍,凭借的就是不断改进的工艺制程,来暴力拉升频率。资历稍老点的玩家应该知道,GDDR3 于 2004 年初次登台亮相时,6600GT 的显存频率仅为 1GHz,并不比 GDDR2高,5 年过去了,GDDR3从 1GHz一路攀升至 2GHz甚至 2.5GHz,生命力得到了延续。明白了 GDDR3的原理技术后,再来看看实物。GDDR3 和 GDDR1类似,也有两种封装形式: 144Ball MBGA 封装,为了向下兼容 GDDR和 GDDR2最初的 GDDR3采用了 144Ball MBGA封装,这与 GDDR和

29、GDDR2第一版完全相同,外观也是正方形,三者的电气性能相似,支持 GDDR3的 GPU也可使用GDDR显存,PCB 和电路只需做少量调整。三星 2.0ns 8M32Bit GDDR3颗粒144Ball封装的 GDDR3只有 8M32Bit一种规格,所以 8颗显存组成 256MB 256Bit、或者 4颗显存组成 128MB 128Bit是当时的主流。5700Ultra 就首次使用了 GDDR3取代了 GDDR2。144Ball封装的 GDDR3主要有 2.0ns(1000MHz)和 1.6ns(1250MHz)两种速度,1.4ns良率不高产量很小,最高频率止步 于 1400MHz。曾被780

30、0GTX/GT、6800GS、6600GT、X850/X800/X700 等显卡大量采用。由于144Ball封装及 PCB 电路限制了其频率的提升,很快 GDDR3就改用了电气性能更好的 136Ball FBGA封装。 136Ball FBGA 封装,频率容量节节攀升为了提高电气性能和环保水平,从 2005年开始,GDDR3 开始采用全新的136Ball FBGA封装,并统一使用无铅封装工艺。新封装使得显卡 PCB必须重新设计,但也为 GDDR3的腾飞铺平了道路。三星 0.8ns GDDR3显存 16M32Bit 规格136Ball封装 GDDR3的优势如下:规格不再局限于 8M32Bit一种

31、,16M32Bit 成为主流,目前 32M32Bit已大量采用;伴随着制造工艺的进步,额定电压从 2.0V进一步降至 1.8V,但一些高频颗粒可适当加压;速度从 1.4ns起跳,经过 1.2ns、1.1ns、1.0ns 一路发展至 0.8ns、0.7ns,最快速度可突破 2500MHz,但这是以牺牲延迟为代价的,好在 GPU对延迟不太敏感;当 GDDR3的频率首次达到 2000MHz时,很多人都认为离极限不远了,于是未雨绸缪的抓紧制定 GDDR4规范,但没想到在 DRAM厂商的努力及新工艺的支持下,GDDR3 的生命得到了延续,0.8ns 0.7ns 的型号相继量产,而且容量更大的32M32B

32、it颗粒也成为主流,基本上能够满足高中低端所有显卡的需要。GDDR3采用了 DDR2的 4bit预取技术,所以采用 DDR3 8bit预取技术的显存只能按顺序命名为 GDDR4。GDDR4 是在 GDDR3的基础上发展而来的,它继承了GDDR3的两大技术特性,但内核改用 DDR3的 8bit预取技术,并加入了一些新的技术来提升频率。SDR,DDR1/2/3,GDDR1/2/3/4/5 详细规格解释(下)(2011-04-04 19:06:00)转载GDDR4的技术特性: 使用 DDR3的 8bit预取技术,以较低的核心频率达到更高带宽,但延迟增加; 采用数据总线转位技术(DBI,Data Bu

33、s Inversion,下文做详细介绍),提高数据精度,降低功耗; 地址线只有 GDDR3的一半,多余线用于电源和接地,有利于提升频率,但导致延迟增加; 采用多重同步码(Multi-Preamble)技术,解决了 GDDR3存在的爆发限制(Burst Limitation),从连续地址读取少量数据时的性能大幅提升; 电压从 1.8V降至 1.5V; 同频功耗下降 75%,2400MHz 的 GDDR4功耗只有 2000MHz GDDR3的一半; 采用 136Ball FBGA封装,单颗 32Bit,向下兼容 GDDR3;GDDR4的确更好超,但性能提升有限由于采用了 8bit预取技术,因此在相

34、同频率下 GDDR4的核心频率(即电容刷新频率)只有 GDDR3的一半,理论上来讲 GDDR4最高频率可达 GDDR3 的两倍。但值得注意的是,虽然核心频率通过 8bit预取技术减半,但 GDDR4与 GDDR3的 I/O频率是完全相同的,因此 GDDR4频率提升 的瓶颈在于 I/O频率而不是核心频率。由于制造工艺和技术水平的限制,虽然三星官方宣称早已生产出 3GHz以上的 GDDR4,但实际出货的 GDDR4只有 2GHz-2.5GHz,此后改进工艺 的 GDDR3也追平了这一频率。在相同频率下,GDDR4 比起 GDDR3虽然功耗发热低,但延迟大性能稍弱,再加上成本高产量小,GDDR4 遭

35、受冷落并不 意外。 导致 GDDR4失败的非技术方面原因GDDR3是 NVIDIA和 ATI参与 JEDEC组织后共同制定的显存标准,而 GDDR4在标准制定过程中双方产生了较大的分歧。NVIDIA 较为保守,认为应该保持DDR2 4bit预取技术不变,继续改进 I/O控制器来提升频率;而 ATI则比较激进,准备直接使用 DDR3 8bit预取技术。双方争执的结果就是在 JEDEC组织中德高望重的 ATI获胜(据称 ATI有位高层在 JEDEC身居要职),而 NVIDIA则明确表示不支持 GDDR4。因 此 GDDR4其实就是 ATI一手策划的,但得不到 NVIDIA支持的话,GDDR4 立马

36、就失去了 6成以上的市场,由此导致 DRAM厂不敢贸然投产。最终只有三星一家生产了少量的 GDDR4显存,其他家都在观望。当然其他DRAM厂商都没闲着,它们把精力都投在了深挖 GDDR3的潜力当中,于是我们看 到了 GDDR3的频率节节攀升,GDDR4 在没有成本优势的情况下,也没有频率优势,恰好当时的几代 A卡更没有性能优势,GDDR4 自然只有死路一条。只有 ATI生产过搭载 GDDR4的显卡,数量虽然不多但横跨了三代产品:X1950XTX、HD2600XT 和 HD3870(也包括对应的专业卡)与 当年 NVIDIA使用GDDR2的显卡数量相等。NVIDIA 在遭遇滑铁卢后果断放弃了 G

37、DDR2,而 ATI对于 GDDR4则是难以割舍,三年时间三代产 品都有使用,但一直都是非主流。GDDR4的失败并不是技术原因,和当年的 GDDR2相比它要成熟很多,没推起来的原因主要是对手太强:ATI 的对手 NVIDIA很强大,另外 GDDR4的对手GDDR3生命力太顽强了。即便使用了 8bit预取技术,可 GDDR4还是没有与 GDDR3拉开频率差距,因为瓶颈在 I/O控制器上面而不是内核,而 GDDR5就是用来解决这一瓶颈的。 GDDR5:恐怖的频率是如何达成的和 GDDR4一样,GDDR5 采用了 DDR3的 8bit预取技术,核心频率显然不是瓶颈,如何提升 I/O频率才是当务之急。

38、但 GDDR5并没有让 I/O频率翻倍,而是使用了两条并行的 DQ总线,从而实现双倍的接口带宽。GDDR5各项总线工作频率示意图双 DQ总线的结果就是,GDDR5 的针脚数从 GDDR3/4的 136Ball大幅增至170Ball,相应的 GPU显存控制器也需要重新设计。GDDR5 显存拥有多达 16个物理 Bank,这些 Bank被分为四组,双 DQ总线交叉控制四组 Bank,达到了实时读写操作,一举将数据传输率提升至 4GHz以上!以往 GDDR1/2/3/4和 DDR1/2/3的数据总线都是 DDR技术(通过差分时钟在上升沿和下降沿各传输一次数据),官方标称的频率 X2就是数据传输率,也

39、就是通常我们所说的等效频率。而 GDDR5则不同,它有两条数据总线,相当于 Rambus的 QDR技术,所以官方标称频率 X4才是数据传输率。比 如 HD4870官方显存频率是 900MHz,而大家习惯称之为 3600MHz。 失败乃成功之母,冒险使用 GDDR5助 RV770挑战 GTX200GDDR4的失败并没有阻挡 ATI前进的脚步,在意识到 GDDR4频率提升的瓶颈之后,GDDR5 草案的制定就被提上日程,ATI 和 NVIDIA技术人员重新聚首,开展第二次合作共商大计。GDDR5 吸取了前辈们的诸多优点,可谓是取其精华弃其糟粕,在 I/O改进方面双方也不再有太多矛盾。技术方面的问题不

40、难解决,最难的是时间和进度。ATI 在 R600上面冒险使用 512Bit显存控制器来提升显存带宽,结果输得一败涂地,于是 RV670只 好回归 256Bit,导致性能原地踏步。而 GDDR4相比 GDDR3没有频率优势,因此ATI迫切的需要 GDDR5迅速投产以满足新一代 GPU的需 要,RV770 只有256Bit,急需高频显存的支持。对手 NVIDIA对于 GDDR5当然很感兴趣,但却一点都不着急,保守的NVIDIA决定坚守 GDDR3,GTX200 核心使用了 512Bit显存控制器 来提升带宽。比起 R600的环形总线,NVIDIA 从 256Bit到 384Bit再到 512Bit

41、一步一个脚印走出来的交叉总线显然更加成熟。以 256Bit对抗 512Bit,ATI 只能将筹码全部押在 GDDR5身上,于是在GDDR5标准尚未完全确立之前,ATI 已经在紧锣密鼓的测试性能,并督促 DRAM厂投产。可以说 GDDR5和 GDDR2/4一样也是个早产儿,但失败乃成功之母,有了完善的技术规格和制造工艺的支持,GDDR5 一出世便令 人刮目相看。凭借 GDDR5翻倍的数据传输率,HD4870 以 256Bit将 448Bit的 GTX260挑落马下,迫使 NVIDIA通过降价、提升规格、改进工艺等诸多手段来反击。128Bit的 HD4770性能也完胜 256Bit的 9600GT

42、并直逼 9800GT。GDDR5在 GDDR3/4优秀特性的基础上,还有诸多改进和新特性,下面就对它们进行详细分析。 数据和地址总线转位技术:信号质量高、功率消耗少在 1Byte数据中的 8个值中,如果超过一半的数值是 0,那么 GDDR5就会自动执行转位传输,把 0变成 1、1 变成 0,通过 1个附加的 DBI(数据总线转位值)来判定数据流是正位还是反位。GDDR5 的这项技术是从 GDDR4继承发展而来的。DRAM在传输数据时,只有 0会消耗电能,减少 0的传输数量,既能保证信号质量,也能减少内部终结电阻和外部终结电路的功率消耗。GDDR5 的地址总线也使用了类似的技术,通过额外的 AB

43、I通道来转位数据流,从而较少信号噪声,并降低功耗。 智能的可编程 I/O控制接口:简化 PCB设计和成本GDDR5对 I/O控制器做了很多改进,加入了全新的自动校准引擎,保证GDDR5显存颗粒更好的适应 GPU显存控制器的需求,确保数据传输稳定可靠。自动校准引擎可以监控电压和温度变化,通过校验数据输出驱动器导通电阻与ODT终结电阻值来作出补偿,数据、地址、指令终结电阻都可以被软件或驱动控制。GDDR5的针脚更多,但布线更简洁此外 GDDR5还能支持时间延迟和信号强度调整,灵活的协调数据同步,以往通过“蛇形走线”平衡延迟的方法彻底成为历史,GDDR5 没有这种顾虑,因此能极大的简化 PCB布线和

44、成本,并有利于冲击更高频率。 数据遮盖技术:减轻数据总线压力GDDR5的 Burst Length(对相邻存储单元连续进行数据传输的周期数)是8bit,也就是说 GDDR5颗粒一次至少要传输 256bit数据,但很多时候并不是所有的数据都需要被改写,导致无效的数据传输。为此,GDDR5 使用了一项数据遮盖技术,通过地址线传输保护信息,所有被保护的数据在传输过程中就不会被改写,只有暴露的数据才会被写入新的数据。如此以来,GDDR5 的数据线压力减轻不少,功耗发热也得到进一步控制。 误差补偿技术:提高传输效率,避免灾难性错误为了保证数据在高速传输过程中的有效性,GDDR5 新增一项错误侦测与修正技

45、术。GDDR5 使用了成熟的 CRC(循环冗余校验),通过 DQ和 DBI总线,实时检查错误,第一时间重新发送数据。这项技术对于高频率传输数据尤为重要,它能有效的减少数据传输错误导致系统崩溃的概率,大幅减少了由超频或高温导致的一系列问题,而且能够一定程度上提升数据传输效率。 折叠模式:32bit 颗粒当作 16bit用GDDR5作为高端显卡专用的显卡,只有 32bit的颗粒。由于 GDDR5拥有两条并行的数据总线,这就使得 GDDR5的工作模式变得更加灵活,它既可以 工作在 32bit模式下也可以工作在 16bit模式下。这样一个 32bit显存控制器就可以控制两颗 GDDR5显存,显存容量可

46、以轻松翻倍。其实,GDDR3/4 都可以通过这种方式扩充显存容量,但原理则完全不同。此前必须 GPU的显存控制器在设计时支持双 Bank模式才能支持更多的显存颗 粒。而现在,8 颗 GDDR5显存总计 256bit可以直接被 128bit的 GPU使用,从而简化了显存控制器设计,HD4770 就是很好的例子。前我们分析过,TSOP 封装的 GDDR1还有 gDDR2显存,其实在技术上与 DDR1/2内存没有本质区别,高位宽(16bit)的内存颗粒可以直接当作 显存使用。随着DDR3颗粒大量投产,成本接近 DDR2,于是在 DDR3内存取代 DDR2的同时,也将顺便取代老旧的 gDDR2。 gD

47、DR3:把内存颗粒改装成显存用以目前的情况来看,DDR3 比 gDDR2频率高很多,但成本比 GDDR3要低,所以 gDDR2被取代是板上钉钉的事。AMD 率先将 DDR3使用在了显卡上,随后得到了业界的一致认可。为了和 DDR3内存颗粒区分,DRAM 厂将其称为 Graphics DDR3 SDRAM,简写为gDDR3,和 DDR3内存颗粒一样都是 8bit预取技术,单颗 16bit,定位中低端显卡;而传统的 GDDR3则是 Graphics GDDR3 SDRAM的简写,它和 DDR2内存一样采用了 4bit预取技术,单颗 32bit,定位中高端显卡。可以看出,在高端 GDDR5将会取代

48、GDDR3,而低端 gDDR3将会取代 gDDR2,中端则会出现三代共存的局面。虽然 gDDR3单颗位宽只有 GDDR3 的一半,但存储密度却是 GDDR3的两倍,而且在相同频率下(比如 2000MHz),gDDR3 的核心频率是GDDR3的一半,因此功耗发热要 低很多。对于位宽不高的中低端显卡来说,gDDR3大容量、低成本、低功耗发热的特性简直相当完美!上图(点我放大)就是现代官方网站列出的 gDDR3和 GDDR3两种显存的规格参数表,注意它们的全称,是否有“G“,真的是差之毫厘谬以千里。 SDR+DDR1/2/3 和 GDDR1/2/3/4/5全系列规格参数汇总: 显存引领 DRAM发展

49、,未来内存将以显存为蓝本开发纵观近年来内存与显存的发展,就会发现显存的发展速度已经远远超越了内存,显存带宽几乎达到了内存带宽的 10倍之多,而且这个差距还在不断的加大。目前三通道 DDR3已经足够桌面 CPU用好一阵子了,而 GPU对显存带宽的渴求似乎是个永远都填不满的无底洞。正因为如此,显存逐渐脱离了内存的发展轨迹,在经过几次并不成功的尝试之后,从内存的配角/附属品,开始走向了反客为主的道路。GDDR2 提前 DDR2近两年、GDDR4 提前 DDR3一年多,虽然都以失败而告终,但却为 GDDR5的成功打下了坚实的基础。在内存领域,如今 DDR3才刚刚站稳脚跟,至少将统治 PC两至三年,但DDR4的标准已经在积极制定当中,而其技术规格将会以 GDDR5为蓝本也就是说保持 DDR3 8bit预取技术不变,改进 I/O控制器,个中原因相信认真阅读了本文的朋友们应该知道吧。gDDR3源于 DDR3,技术特性上没有区别,主要在封装上面。gDDR3 作为对显卡优化的版本,单颗 16bit FBGA 96Ball封装;而 DDR3多为单颗 4/8bit,封装是 78/82Ball。也有少数 DDR3使用了 16bit FBGA 96Ball封装,由于位宽

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报