当前位置:首页 > 每日看点 > 正文内容

因为DeepSeek事件, 美国可能会让英伟达将H20禁售 如何看待?

卡卷网1年前 (2025-02-02)每日看点329

果然懂这其中门道的人不多,但英伟达还是懂的

禁售H20不是针对训练的,是针对推理的

DeepSeek本来也不用H20做训练,他用的是H800做训练,H20就不是训练卡而是推理卡

现在的大模型因为参数量太大,还要支持长上下文和大Batch,对推理算力的需求是远远大过训练的。

DeepSeek具体怎么部署推理集群的方法也是在技术报告里提及了的,但是它只说了用了H800没说用了 H20。他也是采用了PD分离的技术方案,把推理里计算最集中的Prefilling和Decoding两个阶段分别部署到不同的设备上。一般来说,Prefilling阶段需要高算力,Decoding阶段需要大内存。所以Decoding阶段需要大显存低成本的卡。

这其中的大显存低成本的卡很可能就是H20,H20相比H100只有大约一半的价格。

DeepSeek反正训练需要的卡已经买到了,估计还有一些储备,以后扩大训练规模也是够用的,但是DeepSeek开源后必然会有很多人产生私有化部署DeepSeek模型的需求,那么就需要大量的推理算力,H100 H20都禁售可以大幅提高国内大模型的部署成本,推理成本拉高后,就可以抑制了DeepSeek的推广和普及,也变相拖慢了国内大模型应用落地的速度。

不过有个变数,就是910C,很可能华为的910C能填补这个生态位,这回真的要且听龙吟了。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10524.html

分享给朋友:

相关文章

现在做抖音的话,还有机会嘛?

现在做抖音的话,还有机会嘛?

之前我问过小杨哥一个问题:“现在抖音还好做吗?”疯狂小杨哥在抖音已经突破1亿粉丝,直播间10w的在线观看人数,日常带货随便一场也是上7位数的数据。现在抖音的市场好像已经被头部占领,资源靠前,普通人似乎已经没有机会了?下面是小杨哥对于做抖音的...

现在手里有一万闲钱,买什么币好?

今天是2024年7月29日,看看我的持仓吧。只有几百刀的那些微持仓就不说了,以下持仓都在几千刀~几万刀不等。不构成任何投资建议,成本是多次买入的大致均摊成本$TIA 成本0$DYM 成本0 $SAGA 成本0$STRK 成本0$ETHFI...

你手机里有哪些堪称神器的 App?

你手机里有哪些堪称神器的 App?

嗨嗨,我是赢酱~首先我认为对于我们有用的提升自我的都是手机里的神器 App。 一个人应该什么样子呢?在我从女孩子的角度看来,自律,上进,会打扮,情商高,会挣钱,独立,落落大方,这才是应该有的样子,我们可以借助手机不断学习改变今天给大家准备的...

为什么这次 Mac mini 的 M4 版本价格这么低?

为什么这次 Mac mini 的 M4 版本价格这么低?

扫了一眼这里的回答,目测没几个人真买过 Macbook、Mac mini且真正当主力工作机用过。这个初始(丐版)版本的机器实际谈不上多便宜,备受热捧有几个原因。它这代产品整体做了重新设计,大幅缩减了尺寸,真正称得上 Mini 了。对比前代,...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

在 Kubernetes 中,Service 的实现原理是什么,它是如何实现服务发现的?

行,问的这个问题挺有意思,Kubernetes 里 Service 是怎么实现的,服务发现是怎么回事,咱就直说了。这事儿看起来挺玄乎,但掰开揉碎了讲,也就那么回事。你得把这事儿想得简单点,别一上来就被啥术语吓住了——其实全是些搬砖的套路。咱...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。