当前位置:首页 > 每日看点

deepseek是不是吹过头了?

卡卷网1年前 (2025-03-05)每日看点237

谣言 1:国产AI Deepseek-R1吊打美国OpenAI。

真相 1:并没有那么夸张。

DeepSeek-R1拥有与OpenAI公司发布的最强大的ChatGPT-o1(GTP4-Turbo)相当的性能,由于DeepSeek-R1训练过程的开源,OpenAI的护城河变浅了。下图是各项基准测试的得分,R1和o1基本旗鼓相当。


deepseek是不是吹过头了?  第1张

基本旗鼓相当


deepseek是不是吹过头了?  第2张

全球各国AI能力排行,中美第一梯队,但美国还是领先一个身位

谣言 2DeepSeek-R1模型仅用500-600万美元训练,是GPT的1/20。

真相 2:无从考证。

DeepSeek-V3使用了557万美元(估算)进行训练,而OpenAI从未公布其ChatGPT-4以后的模型架构,训练方法和训练成本,从而无法比较。

但是从其api售价上看,Deepseek-R1是ChatGPT-o1的 1/27 ,似乎也能反映一些成本上的端倪。


deepseek是不是吹过头了?  第3张

Api 调用的价格比较


谣言 3:李飞飞等研究人员花费50美金训练出名为s1的推理模型,性能与o1和r1类似。

真相 3:标题党的把戏。关于李飞飞那个新闻仅指出模型在微调阶段使用的云计算算力成本。就是租用云平台微调计算的成本。而训练大语言模型的成本囊括多个方面,算力成本仅是其中之一

  • GPU算力 (自建/云计算)
  • 数据的存储和管理
  • 数据采集/标注
  • 研究人员的劳动报酬

从0到1研发、训练大模型,极其烧钱。光机器、芯片运行起来的电力消耗就十分惊人,GPT-3的单次训练成本就高达140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。50美元玩大语言模型训练,简直是玩呢。。。。

谣言 4:DeepSeek 不应该开源,不能让其他国家轻而易举地掌握核心算法技术。
真相 4:开源 ≠ 出卖核心技术
开源并不是出卖核心技术,而是战略性地共享部分技术以促进创新和生态建设,同时保留关键竞争优势。LLM的核心技术包括哪些?可能包括模型架构(如Transformer)、训练方法、优化算法、数据处理流程、超参数设置等。其中,模型架构本身很多已经是公开的,比如Transformer架构由Google在2017年开源。但具体的实现细节,比如模型参数的调整、训练数据的处理、分布式训练的技术等可能是企业的核心竞争力。DeepSeek 开源的内容聚焦于 基础架构模型与工具链,旨在吸引开发者共建生态,都来玩并且有利可图,而其核心壁垒(高质量标记数据、工程优化、垂直场景技术)仍保留。
就比如你研发了一种独家火锅底料配方,味道美极了,大受欢迎如是你想开连锁餐厅,如是你“开源”

  1. 开源行为:公开基础底料做法(如“牛油+花椒+辣椒”),但隐藏核心原料比例,微量关键配料与熬制工艺。
  2. 竞争对手:能按公开配方开店,但味道始终差一截,因为缺乏你的秘制配方和火候控制技术。
  3. 你的盈利
  • 售卖升级版底料包给连锁店和竞争对手(企业版);
  • 培训厨师如何搭配菜品(技术服务);
  • 打造品牌联盟,收加盟费(生态分成)。

结果

  • 更多人因你的配方有利可图,且降低了入行门槛而进入火锅行业,整个市场变大(现在你经常可以看到某某大公司接入DeepSeek);
  • 你通过控制核心工艺和生态规则,始终是行业龙头;
  • 竞争对手想超越,仍需投入巨资研发你的“未公开技术”。


    所以,对其他公司或国家而言,并不是复制粘贴就可以搞个大模型出来,真正的核心竞争力(数据、算力、人才)仍需自主积累。一向自视甚高的印度在DeepSeek开源后也表示也要10个月推出自己的大模型,且听象吟诗。


deepseek是不是吹过头了?  第4张

China Can , So Can Bharat



谣言 5:目前的AI和 5G ,元宇宙一样,只是成为融资的噱头,并不能产生新的技术革命。
真相 5:AI目前已经渗透到生活的方方面面,从语音助手到推荐算法,再到自动驾驶、医疗诊断、工业智能制造,它的进展是实实在在的。
如果期待是通用人工智能(AGI)的迅速实现,那确实可能让人失望,因为AGI还有很长的路要走,一些技术瓶颈尚未突破。但如果看具体应用,比如生成式AI(如ChatGPT、豆包),它已经带来了生产力的提升和商业模式的变革。AI是可以深度学习,自我优化的,终将在各个领域渗透,效果会逐步显示。已成为一场不可逆的技术变革,并非只是资本炒作。5G 并未带来消费端的“革命”,其商业化进程比预期慢得多。5G是通讯技术,依然在等待其他的技术赶上才能发挥作用。但在企业级市场,如智慧工厂、工业自动化等领域有价值,长期看潜力不容忽视。元宇宙基本上是一个“概念先行、技术跟不上、需求模糊”的典型案例。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/11645.html

分享给朋友:

相关文章

短视频如何快速变现?

短视频如何快速变现?

单人日产200条视频,一晚狂赚上千元,过程却简单到荒唐。 只要你像这只猥琐的海鸥一样,做到这3点就行↓↓ 速度快、不讲武德、不被发现 那做短视频如何做到这3点? 答案是养一只会叼视频的海鸥 不是让你养真的海鸥 而是用 ai 运营方法,类…

怎么用游戏搬砖挣钱呢?

怎么用游戏搬砖挣钱呢?

今天,我把我多年操作的经验分享出来,以供各位老板们学习借鉴,胆小的老板就离开吧,心里承受能力太弱了,会刷新你的认知的。 有些新人在计算收益的时候,会以机器数来计算,其实是有误区的, 比如,一台机器一个月搞400元,平均每天搞13元钱,搞上1…

有了Istio,开发还需要微服务架构吗?

有了Istio,开发还需要微服务架构吗?

Istio 是一个开源的服务网格(Service Mesh),通过它可以实现对服务间通信的管理和监控。对于那些本身没有设计为具备安全功能的传统应用程序,Istio 可以提供一个“透明”的安全保护层,而不需要对应用本身进行任何代码修改。…

PS有哪些实用小技巧,小白也能一学就会?

PS有哪些实用小技巧,小白也能一学就会?

不看后悔系列!本篇分享25个PS实用的技巧! 不能保证每个都能让你惊艳,但是却是我用心写出来的,希望对你有帮助。 另外我的知乎也写了接近200篇PS的技巧,超级合集分享! 我目前正在带一个PS/Ai的软件训练营,两个多月搞定两大软件的学…

为什么大家都说手机性能永远超不过PC?

最新的天玑9400牛逼吧,堪称PC级CPU,测试成绩16W功耗能跑9500分,1.8W能跑3000分,GPU也差不多是这个情况。 手机电池一般是4000-5000毫安时,电压3.7V。 也就是说,手机正常满载5W功耗下,这个电池能支持运行4…

下一个风口最可能是什么?

下一个风口最可能是什么?

肯定是一带一路了,国内没什么卷的空间了,现在国家正在给一带一路的第三世界国家建设基础设施,等交通打通之后,就是通信打通,通信打通就是贸易打通,未来我建议大家重仓小语种,阿拉伯语最值得学(也有其他小语种自己去查一带一路国家),将来去其他国家随…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。