卡卷网
当前位置:卡卷网 / 每日看点 / 正文

中国 DeepSeek 大模型成本优势,会不会打破英伟达和美股科技股的泡沫?

作者:卡卷网发布时间:2025-02-02 19:06浏览数量:115次评论数量:0次

看了不少关于DeepSeek赢的言论,真是和之前的光刻机和光刻厂一样的既视感,有太多论调既不符合Tech行业常识,也不符合商业逻辑。

从模型上来说。可以说算法蒸馏别人的模型是站在巨人肩膀上,但是巨人的肩膀就一直可以免费站吗?我抛砖引玉,说一个最简单规避别人做算法蒸馏的办法。闭源商业模型的企业,不会再把最新最好的高性能大模型拿到C端了,即使C端付费甚至中小企业也不会拿到。人家只会公开一款永远半代领先这类偏重算法蒸馏第三方模型的产品。为了这半代迭代,偏重算法蒸馏的大模型不值得来算法蒸馏我。就算愿意蒸馏,等你蒸馏我以后,时间也够我继续迭代第二个版本了。

届时,真正能体现出尖端研究成果的大模型,API会以高价开放给批量付费的B端大客户,而且闭源大模型必然会要求B端签订一系列带违约金要求的协议,包括但不限于严格限定使用范围和用途,限制问答范围和并发数量。偏重算法蒸馏的模型,很难再能直接接触到这一类拿GPU堆起来的模型。

从GPU角度来说。很多过客对于GPU算力缺口有多大,完全没有认知。总不能说,因为蒸馏别人用大规模GPU训练出来的AI,就反过来说GPU对AI需求下降了。

举个最简单的例子,RTX5090这种能拿来做推理的民用显卡,算是各位都可以公开透明验证价格的。那么,各位别听网上的人人云亦云,不妨自己去查查RTX5090降价了吗?别说降价了,各家上游PCBA货都拿不到,哪来的自信不缺GPU了?至于GB200这种计算卡,更是连明年的“期货”都分完了。

通过优化算法减少GPU,本身就是各家都在做的事情,只不过做多做少罢了。难道DeepSeek以前,各家就都不做优化算法节省GPU算力的吗?这明显是不符合常识的。如果只要做算法优化,就能让算力芯片厂商破产,那NVIDIA、Boardcom也不至于身价暴涨了。人类对算力的需求趋近于无限,就算有了节省算力的新算法,必然的选项是继续扩增模型,而不是固步自封。

对于美国来说,工程师工资高,同时大量工程师要大量依赖高技术移民,反而是可以不限量购买的GPU更廉价,解决问题更直接。所以,美国的AI企业不到万不得已,不会用大量工程师资源来解决算力问题,工程师还有更重要的事要做。因为众所周知的原因,GPU在DeepSeek母国是紧缺资源,因此,工程师反而成了更廉价,更直接的解决方案。

但是最终,我们还是要思考一个问题,GPU从产线上一颗一颗封装出来的边际成本是多少?工程师是有限的,而GPU是无限的。纵观整个Tech行业的发展向,利用人力资源解决可量产硬件的性能,一直都是优先选项,而软件永远是大胃王,有多少硬件就吃掉多少硬件。

在我看来,DeepSeek的本质还是在于高效利用了既有且易得的资源打了一个时间差。时间会验证每个人观点对错与否,半年左右基本上就会水落石出。我们拭目以待,如果半年以后DeepSeek泯然众人,当初人云亦云那批人选择性遗忘了,那我就当看个乐子。如果半年以后,DeepSeek全面领先闭源AI,NVIDIA找TSMC砍单了,那挨打要立正,我也一定会回这个问题下自己声讨自己。

END

免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。

卡卷网

卡卷网 主页 联系他吧

请记住:卡卷网 Www.Kajuan.Net

欢迎 发表评论:

请填写验证码