当前位置:首页 > 每日看点 > 正文内容

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?

卡卷网1年前 (2025-01-15)每日看点229

当内存来到DDR5这一代之后,内存的传输速度可谓突飞猛进。

DDR4时代以2333MT/s~2600MT/s为主,超频到3200MT/s,已经是非常了不起。

DDR5起步就是4800MT/s,到了2024年,主流DDR5内存来到了6400MT/s,预计2025年~2026年会到达8000MT/s。

如此巨大的进步,除了制程上的进步,组织结构上的优化,最大的功臣,其实是DFE。今天我们就来看看DFE是如何给DDR5内存开天眼的。

眼图

“开天眼”这个词是不是觉得有点唐突,实际上,DFE的目的,就是开眼,这里所说的眼,是信号的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第1张

对于EE专业的同学来说,眼图是再熟悉不过的概念。可能有第一次听说眼图的同学,我这里就以最短篇幅快速介绍一下。

理想的数字信号,高电平就是1,低电平就是0,所以信号都是直上直下的方波信号,但实际的信号,上升或下降是一个过程,就像下图中所示的,是斜的。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第2张

我们把各个周期的信号叠加在一起,就形成一个像眼睛一样的图形,我们称之为眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第3张

理想的眼图,是一个接近长方形的圆,我们说眼睛睁的很大

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第4张

但真实的信号,会有各种各样的畸变,延迟,反射


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第5张

眼图看起来就会很乱,“眼睛”很小甚至没有:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第6张

背景

当DRAM的数据传输率超过 2933MT/s时,码间干扰(ISI Inter Symbol Interference)会急剧增加,以至于内存的眼睛无法睁开,比如下图是6Gb/s速度下的眼图,可以说徐志胜笑起来都比这个眼睛大。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第7张

这便是阻碍内存速度提高的一大障碍。


反射脉冲

如果把信号线想象成一根管道,当你在一头说话,在另一头就能听到你讲话。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第8张

管道内是有回声的。

如果你说话很慢,尽管有回声,但是不影响正常沟通。

如果你说话极其快,你的声音和回声会混在一起,对方就听不到你在说啥了。

DDR5的On Die termination就是尽量降低阻抗上的各种回声,提升信号完整性(On Die Termnination我会有专门的文章来介绍)。但是对于高速信号,这依然不够。

下图是DDR spec上一个反射脉冲的例子:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第9张

可以看到在信号边缘有一个60mV和一个20mV的波动,这两个波动叠加到下一个周期的信号中,就会严重影响眼图。


均衡器(Equalization)

对于失真信号,需要均衡器用来提升信号的质量。均衡器的思路其实是非常简单,说白了就是对信道的补偿。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

直白地说,h代表了传输过程中带给信号的影响,包括噪声,畸变,码间干扰,等等等等。那如何抵消H的影响呢?聪明的你马上就想到了,给他乘以 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 不就行了?

恭喜你,发明了均衡器!

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

这个 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 就是均衡器。

均衡器可以放在发送端,也就是说你再发送的时候就预计到可能发生的信号失真和损失(比如高频衰减快,低频衰减慢),将发送信号叠加上补偿,这样经过传输之后可以得到预期的信号,这就是前端均衡器。

最常见的均衡器是CTLE和DFE,大家在大部分和信号相关的领域都能看到这两个概念的出现。

CTLE(Continuous Time Linear Equalizer)是线性高通滤波器,作为前端均衡器,通常对有限信号做补偿,CTLE的原理很简单,因为高频信号衰减大,所以通过衰减低频信号分量来补偿奈奎斯特频率附近的衰减比例。CTLE的优点是线性滤波,不会引入非线性失真,但缺点是会放大噪声。

DFE(Decision Feedback Equalizer)是反馈滤波器,作为后端均衡器,反馈滤波器可以将已接收的信号作为输入,可以很好的抵消码间干扰。今天我们着重要看的就是DFE。

DFE

先放一个流程图,然后我们一步步来讲解。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第14张

在前面的小节中提到反射脉冲时,我们已经知道,输出信号到达接收端的时候,不仅自身受到了信道的影响,同时反射信号也会叠加在接收端。可以简单的用公式来表示这个过程:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 由三部分组成:

  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是我们需要的信号;
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是码间干扰(ISI);
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是噪声

我们在接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 之后加一个前端滤波器用来补偿信道的损失:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

最终的信号,需要减去码间干扰(ISI)的部分,这是DFE反馈均衡器的结果。

在某一个时间点k,接收端已经有了对之前信号的决策,所以当前时间点在接收端需要减去之前所有信号的码间干扰(ISI)的部分:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

假设对之前信号的决策正确的情况下( DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 ),就得到了如下结果:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

从这里也可以看出,DFE可以完全去除ISI的部分,但是和CTLE不同的是,噪声的部分并没有加强。

DFE的内部是将一定数目的过去的数据以特定的加权值去做一个加法,以达到抵消码间干扰(ISI)的目的,这也正是“反馈”所代表的意思。

下图是一个5-tap DFE的示意图:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第26张

DDR5 DFE (Decision Feedback Equalization)

DDR5引入了一个4-tap的DFE,前端的增益控制(Gain)用于确保当前信号位与所需矫正的码间干扰(ISI)保持一致关系,四个Tap通过Bias Multiplier对码间干扰(ISI)的影响做了加权矫正。


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第27张

JEDEC的spec里还定义2-way interleaved 4-tap DFE和4-way interleaved 4-tap DFE,这个大家了解一下就可以了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第28张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第29张

DDR5这一代新增了一百多个MR(Mode Register),几乎都是和DFE相关的。

从MR112开始,5个为一组,MR112~MR116

MR112指定DFE gain(前端增益),MR113,MR114,MR115,MR116分别指定每一个Tap的Bias。

SDRAM的DM信号和所有DQ信号都需要DFE,所以对于DML,DMU,以及最多16个DQ (x16 SDRAM),每个信号都有MR来配置DFE。当然,x4,x8的SDRAM只用到其中的一部分。

这是MR具体的定义,知道一下就行了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第30张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第31张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第32张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第33张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第34张

总结

高速信号的码间干扰(ISI)对眼图构成极其严重的影响,DFE作为一直反馈均衡器,非常适合消除码间干扰(ISI),像变魔术一样,将杂乱无章的眼图变成清晰的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第35张

DFE是DDR5的速度大幅提升的功臣,现在主流DDR5内存都来到6400MT/s,2025~2026年,我们将看到8000MT/s成为新的主流。

当然DFE也带来一些不大不小的麻烦,最主要的就是对启动时间的影响,内存在初始化训练(memory training)的时候,由于引入了DFE,单个rank的时间通常增加了10~100秒不等(或者更久),所以搭载DDR5内存的系统第一次启动的时间比DDR4有明显增加。

对于终端用户来说,你完全不必关心这里的技术原理。对技术感兴趣的同学可以了解下,这里面其实有太多的知识点可以延伸(我写作时会尽量克制)。也欢迎大家订阅我的专栏,我会持续分享干货知识。

DDR5的世界

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/9373.html

分享给朋友:

相关文章

你有突破100个粉丝了吗?

你有突破100个粉丝了吗?

100粉已经过啦!说说怎么过的吧,最开始疯狂的写回答,写想法,关注人数在50几以下持续有两周多,每天都关注变化,都是个位数增长,后来干脆不看了。到第三周时突然一周增长了100多人,一天十几人,想想应该归功于多互动,给他人点赞评论,让自己曝光...

自媒体如何快速起步?

自媒体如何快速起步?

有两种经验,可供参考。第一种是:现象级的爆火、爆款,这种情况捞到钱,实现财务自由的人并不多,但确实存在。只不过非要说清楚为什么这个账号可以火、可以短时间内赚到普通人一辈子赚不到的钱,他们自己也不一定能说清楚,因为赶上了风口(内外部情况)。举...

NAS那么好,为什么还是没能成为大多数家庭必备的存储设备?

NAS那么好,为什么还是没能成为大多数家庭必备的存储设备?

最主要原因是因为——贵!看看我家里搭建的这一套吧。目前我家中有5台常用的NAS,分别为群晖DS1522+、威联通TS-464C2、绿联DX4600 Pro 、极空间Z4S、威联通TS-AI642。个人认为,这其中的每台NAS都是时代的翘楚,...

中国芯片产量达1399亿颗,这意味着什么?

美国并不是没有明白人,只是特朗普不懂芯片产业的情况,冒冒失失在ZZ正确下,开启了对中国芯片的掐脖子,结果没掐死,反而让人练出了铁肺。芯片是所有科技产业的上游,美国原本在上游呆得很舒服,靠英伟达、AMD、德州仪器、高通等这些几十年霸主地位的公...

在追求家居美学的过程中,如何选择一款电视机,使其既具备出色的音画质又能与家居装饰相得益彰?

在追求家居美学的过程中,如何选择一款电视机,使其既具备出色的音画质又能与家居装饰相得益彰?

先看照片,你就说美不美吧?我家这个40平的客厅东西放得不少,其中最提升观感的是各种灯光,在这么多灯光中,是不是第一眼视觉中心就落在了电视上?没错,因为这电视是非常特别的环景光电视,与显示器的神光同步一样,会随着画面的变化而变化不同的光效,它...

年收入40万的网文作者,是不是可以吊打任何职业了?

哈,我二十岁的时候也这么狂。想当年,我一个大二学生,在宿舍里写出一本大精品,月入两万五,在学校里走路都是横着的,游戏卡池一开,看都不看,氪到出货为止。iPhone12pro一发布直接买,还买了个iPad Pro,都是官网直接买的,Apple...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。