当前位置:首页 > 每日看点 > 正文内容

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?

卡卷网7个月前 (01-15)每日看点141

当内存来到DDR5这一代之后,内存的传输速度可谓突飞猛进。

DDR4时代以2333MT/s~2600MT/s为主,超频到3200MT/s,已经是非常了不起。

DDR5起步就是4800MT/s,到了2024年,主流DDR5内存来到了6400MT/s,预计2025年~2026年会到达8000MT/s。

如此巨大的进步,除了制程上的进步,组织结构上的优化,最大的功臣,其实是DFE。今天我们就来看看DFE是如何给DDR5内存开天眼的。

眼图

“开天眼”这个词是不是觉得有点唐突,实际上,DFE的目的,就是开眼,这里所说的眼,是信号的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第1张

对于EE专业的同学来说,眼图是再熟悉不过的概念。可能有第一次听说眼图的同学,我这里就以最短篇幅快速介绍一下。

理想的数字信号,高电平就是1,低电平就是0,所以信号都是直上直下的方波信号,但实际的信号,上升或下降是一个过程,就像下图中所示的,是斜的。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第2张

我们把各个周期的信号叠加在一起,就形成一个像眼睛一样的图形,我们称之为眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第3张

理想的眼图,是一个接近长方形的圆,我们说眼睛睁的很大

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第4张

但真实的信号,会有各种各样的畸变,延迟,反射


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第5张

眼图看起来就会很乱,“眼睛”很小甚至没有:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第6张

背景

当DRAM的数据传输率超过 2933MT/s时,码间干扰(ISI Inter Symbol Interference)会急剧增加,以至于内存的眼睛无法睁开,比如下图是6Gb/s速度下的眼图,可以说徐志胜笑起来都比这个眼睛大。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第7张

这便是阻碍内存速度提高的一大障碍。


反射脉冲

如果把信号线想象成一根管道,当你在一头说话,在另一头就能听到你讲话。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第8张

管道内是有回声的。

如果你说话很慢,尽管有回声,但是不影响正常沟通。

如果你说话极其快,你的声音和回声会混在一起,对方就听不到你在说啥了。

DDR5的On Die termination就是尽量降低阻抗上的各种回声,提升信号完整性(On Die Termnination我会有专门的文章来介绍)。但是对于高速信号,这依然不够。

下图是DDR spec上一个反射脉冲的例子:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第9张

可以看到在信号边缘有一个60mV和一个20mV的波动,这两个波动叠加到下一个周期的信号中,就会严重影响眼图。


均衡器(Equalization)

对于失真信号,需要均衡器用来提升信号的质量。均衡器的思路其实是非常简单,说白了就是对信道的补偿。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

直白地说,h代表了传输过程中带给信号的影响,包括噪声,畸变,码间干扰,等等等等。那如何抵消H的影响呢?聪明的你马上就想到了,给他乘以 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 不就行了?

恭喜你,发明了均衡器!

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

这个 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 就是均衡器。

均衡器可以放在发送端,也就是说你再发送的时候就预计到可能发生的信号失真和损失(比如高频衰减快,低频衰减慢),将发送信号叠加上补偿,这样经过传输之后可以得到预期的信号,这就是前端均衡器。

最常见的均衡器是CTLE和DFE,大家在大部分和信号相关的领域都能看到这两个概念的出现。

CTLE(Continuous Time Linear Equalizer)是线性高通滤波器,作为前端均衡器,通常对有限信号做补偿,CTLE的原理很简单,因为高频信号衰减大,所以通过衰减低频信号分量来补偿奈奎斯特频率附近的衰减比例。CTLE的优点是线性滤波,不会引入非线性失真,但缺点是会放大噪声。

DFE(Decision Feedback Equalizer)是反馈滤波器,作为后端均衡器,反馈滤波器可以将已接收的信号作为输入,可以很好的抵消码间干扰。今天我们着重要看的就是DFE。

DFE

先放一个流程图,然后我们一步步来讲解。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第14张

在前面的小节中提到反射脉冲时,我们已经知道,输出信号到达接收端的时候,不仅自身受到了信道的影响,同时反射信号也会叠加在接收端。可以简单的用公式来表示这个过程:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 由三部分组成:

  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是我们需要的信号;
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是码间干扰(ISI);
  • DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 是噪声

我们在接收信号 DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 之后加一个前端滤波器用来补偿信道的损失:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

最终的信号,需要减去码间干扰(ISI)的部分,这是DFE反馈均衡器的结果。

在某一个时间点k,接收端已经有了对之前信号的决策,所以当前时间点在接收端需要减去之前所有信号的码间干扰(ISI)的部分:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

假设对之前信号的决策正确的情况下( DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张 ),就得到了如下结果:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第10张

从这里也可以看出,DFE可以完全去除ISI的部分,但是和CTLE不同的是,噪声的部分并没有加强。

DFE的内部是将一定数目的过去的数据以特定的加权值去做一个加法,以达到抵消码间干扰(ISI)的目的,这也正是“反馈”所代表的意思。

下图是一个5-tap DFE的示意图:

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第26张

DDR5 DFE (Decision Feedback Equalization)

DDR5引入了一个4-tap的DFE,前端的增益控制(Gain)用于确保当前信号位与所需矫正的码间干扰(ISI)保持一致关系,四个Tap通过Bias Multiplier对码间干扰(ISI)的影响做了加权矫正。


DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第27张

JEDEC的spec里还定义2-way interleaved 4-tap DFE和4-way interleaved 4-tap DFE,这个大家了解一下就可以了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第28张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第29张

DDR5这一代新增了一百多个MR(Mode Register),几乎都是和DFE相关的。

从MR112开始,5个为一组,MR112~MR116

MR112指定DFE gain(前端增益),MR113,MR114,MR115,MR116分别指定每一个Tap的Bias。

SDRAM的DM信号和所有DQ信号都需要DFE,所以对于DML,DMU,以及最多16个DQ (x16 SDRAM),每个信号都有MR来配置DFE。当然,x4,x8的SDRAM只用到其中的一部分。

这是MR具体的定义,知道一下就行了。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第30张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第31张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第32张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第33张

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第34张

总结

高速信号的码间干扰(ISI)对眼图构成极其严重的影响,DFE作为一直反馈均衡器,非常适合消除码间干扰(ISI),像变魔术一样,将杂乱无章的眼图变成清晰的眼图。

DDR5 内存是如何做到速度相比 DDR4 实现「质的飞跃」的?  第35张

DFE是DDR5的速度大幅提升的功臣,现在主流DDR5内存都来到6400MT/s,2025~2026年,我们将看到8000MT/s成为新的主流。

当然DFE也带来一些不大不小的麻烦,最主要的就是对启动时间的影响,内存在初始化训练(memory training)的时候,由于引入了DFE,单个rank的时间通常增加了10~100秒不等(或者更久),所以搭载DDR5内存的系统第一次启动的时间比DDR4有明显增加。

对于终端用户来说,你完全不必关心这里的技术原理。对技术感兴趣的同学可以了解下,这里面其实有太多的知识点可以延伸(我写作时会尽量克制)。也欢迎大家订阅我的专栏,我会持续分享干货知识。

DDR5的世界

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/9373.html

分享给朋友:

相关文章

如果我们没有自己的手机操作系统,会出现所谓的“卡脖子”“安全”问题吗?

如果我们没有自己的手机操作系统,会出现所谓的“卡脖子”“安全”问题吗?

前段时间某某高管在微博发文表示:“其实我觉得,中国人需要的不是一个自己的手机os,而是一个全国产的微信,再搭配一些辅助功能。”这算是“安卓开源”开源的代表了吧。然而打脸来的如此之快,10月30日消息,在Linux内核疑似大规...

推荐几个问卷调查平台?

推荐几个问卷调查平台?

我给大家免费推荐一些市面上不多,且稳定的免费的问卷平台,这个在网上都是能够搜索到的,有的还是世界500钱企业,这里推荐的基本上都是上市的问卷公司了。上面都是可以免费去注册的,对外公开开放的,做完了直接奖励美刀的,不需要兑换卡什么的。Cint...

如何在自己家里建立一套私有云系统?需要哪些设备?

如何在自己家里建立一套私有云系统?需要哪些设备?

我敢保证,这绝对是目前为止最简单的搭建家用私有云的方法:“一台主机+至少一块硬盘”足矣!不需要任何专业知识,也没有复杂繁琐的步骤,十分钟不到就能搭建好,帮你成功打开文件云储存新世界的大门!还在单纯依靠网盘进行文件存储的朋友,不是我吐槽哈,它...

到什么程度才叫精通 Linux?

我们医院有个大牛。有一次,我的Linux电脑下载了Microsoft office 365 不能运行。于是买了2.5升装康师傅冰红茶找到大牛,让他帮忙解决。大牛白了我一眼,让我把安装包发给他,只见他输入一个命令将安装包打开,整个屏幕都是数字...

荣耀magic 7 首发的应该都收到货了,感觉怎么样?

8号入手magic7,跟mate40pro比。优点:1、电池真耐用,充电块,华为电池也是新换的但是明显荣耀耐用;2、系统明显快多了,mate40pro下半年开始卡的不行,实在受不了了。3、声音、震动效果提升明显,指纹反应灵敏很多。 缺点:1...

无意中发现技术主管写的代码,大家帮忙看看什么水平?

无意中发现技术主管写的代码,大家帮忙看看什么水平?

虽然很多答主用了诸如“典范级”、“心旷神怡” 的形容, 赞美这段代码, 但这里, 出于技术讨论的动机, 我说说不同看法.栈, 如果善于利用栈来处理树结构, 那么可以写出更简洁的代码, 根本不需要 recuresiveFn 这种方法. 泛型,...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。