当前位置:首页 > 每日看点 > 正文内容

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?

卡卷网11个月前 (01-15)每日看点205

当内存来到DDR5这一代之后,内存的传输速度可谓突飞猛进。

DDR4时代以2333MT/s~2600MT/s为主,超频到3200MT/s,已经是非常了不起。

DDR5起步就是4800MT/s,到了2024年,主流DDR5内存来到了6400MT/s,预计2025年~2026年会到达8000MT/s。

如此巨大的进步,除了制程上的进步,组织结构上的优化,最大的功臣,其实是DFE。今天我们就来看看DFE是如何给DDR5内存开天眼的。

眼图

“开天眼”这个词是不是觉得有点唐突,实际上,DFE的目的,就是开眼,这里所说的眼,是信号的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第1张

对于EE专业的同学来说,眼图是再熟悉不过的概念。可能有第一次听说眼图的同学,我这里就以最短篇幅快速介绍一下。

理想的数字信号,高电平就是1,低电平就是0,所以信号都是直上直下的方波信号,但实际的信号,上升或下降是一个过程,就像下图中所示的,是斜的。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第2张

我们把各个周期的信号叠加在一起,就形成一个像眼睛一样的图形,我们称之为眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第3张

理想的眼图,是一个接近长方形的圆,我们说眼睛睁的很大

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第4张

但真实的信号,会有各种各样的畸变,延迟,反射


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第5张

眼图看起来就会很乱,“眼睛”很小甚至没有:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第6张

背景

当DRAM的数据传输率超过 2933MT/s时,码间干扰(ISI Inter Symbol Interference)会急剧增加,以至于内存的眼睛无法睁开,比如下图是6Gb/s速度下的眼图,可以说徐志胜笑起来都比这个眼睛大。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第7张

这便是阻碍内存速度提高的一大障碍。


反射脉冲

如果把信号线想象成一根管道,当你在一头说话,在另一头就能听到你讲话。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第8张

管道内是有回声的。

如果你说话很慢,尽管有回声,但是不影响正常沟通。

如果你说话极其快,你的声音和回声会混在一起,对方就听不到你在说啥了。

DDR5的On Die termination就是尽量降低阻抗上的各种回声,提升信号完整性(On Die Termnination我会有专门的文章来介绍)。但是对于高速信号,这依然不够。

下图是DDR spec上一个反射脉冲的例子:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第9张

可以看到在信号边缘有一个60mV和一个20mV的波动,这两个波动叠加到下一个周期的信号中,就会严重影响眼图。


均衡器(Equalization)

对于失真信号,需要均衡器用来提升信号的质量。均衡器的思路其实是非常简单,说白了就是对信道的补偿。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

直白地说,h代表了传输过程中带给信号的影响,包括噪声,畸变,码间干扰,等等等等。那如何抵消H的影响呢?聪明的你马上就想到了,给他乘以 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 不就行了?

恭喜你,发明了均衡器!

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

这个 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 就是均衡器。

均衡器可以放在发送端,也就是说你再发送的时候就预计到可能发生的信号失真和损失(比如高频衰减快,低频衰减慢),将发送信号叠加上补偿,这样经过传输之后可以得到预期的信号,这就是前端均衡器。

最常见的均衡器是CTLE和DFE,大家在大部分和信号相关的领域都能看到这两个概念的出现。

CTLE(Continuous Time Linear Equalizer)是线性高通滤波器,作为前端均衡器,通常对有限信号做补偿,CTLE的原理很简单,因为高频信号衰减大,所以通过衰减低频信号分量来补偿奈奎斯特频率附近的衰减比例。CTLE的优点是线性滤波,不会引入非线性失真,但缺点是会放大噪声。

DFE(Decision Feedback Equalizer)是反馈滤波器,作为后端均衡器,反馈滤波器可以将已接收的信号作为输入,可以很好的抵消码间干扰。今天我们着重要看的就是DFE。

DFE

先放一个流程图,然后我们一步步来讲解。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第14张

在前面的小节中提到反射脉冲时,我们已经知道,输出信号到达接收端的时候,不仅自身受到了信道的影响,同时反射信号也会叠加在接收端。可以简单的用公式来表示这个过程:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 由三部分组成:

  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是我们需要的信号;
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是码间干扰(ISI);
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是噪声

我们在接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 之后加一个前端滤波器用来补偿信道的损失:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

最终的信号,需要减去码间干扰(ISI)的部分,这是DFE反馈均衡器的结果。

在某一个时间点k,接收端已经有了对之前信号的决策,所以当前时间点在接收端需要减去之前所有信号的码间干扰(ISI)的部分:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

假设对之前信号的决策正确的情况下( DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 ),就得到了如下结果:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

从这里也可以看出,DFE可以完全去除ISI的部分,但是和CTLE不同的是,噪声的部分并没有加强。

DFE的内部是将一定数目的过去的数据以特定的加权值去做一个加法,以达到抵消码间干扰(ISI)的目的,这也正是“反馈”所代表的意思。

下图是一个5-tap DFE的示意图:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第26张

DDR5 DFE (Decision Feedback Equalization)

DDR5引入了一个4-tap的DFE,前端的增益控制(Gain)用于确保当前信号位与所需矫正的码间干扰(ISI)保持一致关系,四个Tap通过Bias Multiplier对码间干扰(ISI)的影响做了加权矫正。


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第27张

JEDEC的spec里还定义2-way interleaved 4-tap DFE和4-way interleaved 4-tap DFE,这个大家了解一下就可以了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第28张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第29张

DDR5这一代新增了一百多个MR(Mode Register),几乎都是和DFE相关的。

从MR112开始,5个为一组,MR112~MR116

MR112指定DFE gain(前端增益),MR113,MR114,MR115,MR116分别指定每一个Tap的Bias。

SDRAM的DM信号和所有DQ信号都需要DFE,所以对于DML,DMU,以及最多16个DQ (x16 SDRAM),每个信号都有MR来配置DFE。当然,x4,x8的SDRAM只用到其中的一部分。

这是MR具体的定义,知道一下就行了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第30张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第31张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第32张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第33张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第34张

总结

高速信号的码间干扰(ISI)对眼图构成极其严重的影响,DFE作为一直反馈均衡器,非常适合消除码间干扰(ISI),像变魔术一样,将杂乱无章的眼图变成清晰的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第35张

DFE是DDR5的速度大幅提升的功臣,现在主流DDR5内存都来到6400MT/s,2025~2026年,我们将看到8000MT/s成为新的主流。

当然DFE也带来一些不大不小的麻烦,最主要的就是对启动时间的影响,内存在初始化训练(memory training)的时候,由于引入了DFE,单个rank的时间通常增加了10~100秒不等(或者更久),所以搭载DDR5内存的系统第一次启动的时间比DDR4有明显增加。

对于终端用户来说,你完全不必关心这里的技术原理。对技术感兴趣的同学可以了解下,这里面其实有太多的知识点可以延伸(我写作时会尽量克制)。也欢迎大家订阅我的专栏,我会持续分享干货知识。

DDR5的世界

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/9373.html

分享给朋友:

相关文章

感觉手机配置都差不多,为什么有的手机能卖2k-3k,而有的手机却能卖到6k-8k?

感觉手机配置都差不多,为什么有的手机能卖2k-3k,而有的手机却能卖到6k-8k?

与所有的商品一样,手机的价格,也是由它的成本所决定的。虽然看起来3000元的手机和6000的手机配置差不多,甚至处理器都可能是同一个,但在很多大家容易忽略的地方,决定了两者价格的不同:例如手机的外观,塑料的机身,与素皮机身和玻璃机身就完全不...

如何看待 Luv Letter 表示影视飓风专业性实在是让人失望?

一点儿新进展,另外以下有部分需要关注对于统一变量的问题。这个我在对比上面有写小字解释,我在一开始使用ffmpeg来控制变量。但是发现了不少问题,比如因为遗留bug,会强制将非整数帧的素材转码为VFR导致无法正确帧间对比,因此不考虑,同时尽量...

中国的科技为什么在最近2-3年时间像突然大爆发一样?

这个真的得感谢1998年美国在南联盟使馆投的两颗大炸弹。在80年代中国下马了一千多个项目,用资金进口了近一百万辆小汽车。我记得小时候有一段时间从海南岛开往北方的漂亮日本小面包车,密集从村前公路上驶过,连过路的间隙都没有,就这样接连开了一个星...

OLED、QLED还是Mini LED?如何在今年双十一选购一款最适合自己的电视?

OLED、QLED还是Mini LED?如何在今年双十一选购一款最适合自己的电视?

我家旧电视用了好几年了,最近毛病越来愈多,动不动就黑屏,让人特别扫兴。这阵子和家人商量着,趁着现在国家有家电补贴,再加双11大促,不如换一台好一点的新电视,而现在MiniLED技术成熟,很多电视都升级MiniLED了,无论在画面亮度、细节、...

求一个超级丐的nas,要求足够便宜?

求一个超级丐的nas,要求足够便宜?

看了几个方案,门槛都太高了。我个人是比较推荐猫盘(小猫)的,一百块钱左右就有,一般卖家都会刷好刷不死固件,轻而易举就能按教程一步步刷成黑群晖,实在手残稍微添点让卖家刷好也行。图是我放到张大妈的,懒得找原图了这玩意儿最大的buff是,硬件和白...

如何看待麒麟9020单核跑分较9010提升仅5%,不及预期?

在国产光刻机没有突破之前,华为靠中芯国际用进口浸润式DUV光刻机(国内有150多台,典型工艺制程是7-28nm,潜在产能能满足市场需求,只是不知道几家能用到7nm)堆成的类残血版5nm工艺(按照中芯之前的研发进度推断,应该可以实现),将手机...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。