DeepSeek 那么厉害为什么要开源?
作者:卡卷网发布时间:2025-02-17 21:02浏览数量:69次评论数量:0次
诸位可想过:Deepseek为何要开源?
咱们明白,因为美国对显卡的管控,导致显卡数量不足,Deepseek便被迫创新出了极强的方法,以弥补算力差距。如果deepseek和openai的数据都是真的,deepseek只有2000张H800显卡,而Openai仅是H100就达到了三万左右的数量。
那deepseek为何要开源?如果目的是抗衡OpenAI的话,不应该保住优势方法吗,使得deepseek方是强方法弱算力,抗衡openai强算力弱方法,双方都处于一强一弱才能抗衡吧。
现在选择开源,把优势方法大方送给openai,如果openai全盘采用的话,那岂不是说openai立马重获强方法+强算力,双强?刚刚抗衡又将被拉开?而deepseek方法一样,算力劣势,岂不是又将落后?为了量化公司做空英伟达?为了打脸美国AI公司?好像都没有持续抗衡重要吧,更何况如果OpenAI凭借大量的算力与deepseek开源的方法快速提升,发布新版本,提升巨大的话,现在做的一切不又都化作乌有了?
所以为什么要开源呢?
因为Deepseek,是专精模型,而非AGI。
就算开源,OpenAI也使不上。
Deepseek的MOE架构
Deepseek将Mixture of Experts(MoE)架构发扬光大,即模型由多个“专家”模块组成,每次仅激活部分参数以执行特定任务(如数学、编程)。这种方式在计算资源受限的情况下能极大提升特定领域的能力,但其泛化能力不及全参数激活的AGI。
因此,Deepseek本质上更接近一个专精模型,而非像ChatGPT等具备更广泛能力的AGI。
如果将ChatGPT等AGI比作“全知全能的单独超级个体”,那么Deepseek更像是由多个领域专家组成的团队。
举个例子,一个同时精通物理和化学的双料专家,比一个物理学家和一个化学家合作的价值大太多,这并非是一加一等于二的问题,同时精通多领域的人可以敏锐且完整的察觉到行业之间的联系,其内部更加的圆融合一,擅长跨领域结合创新,所以精通几乎所有领域的单体AGI,其上限显然是极高的。
而deepseek,是一群专家组成的团队,虽然在面对单学科问题的时候可以派出一位专家来解决问题,但是在面对跨学科问题的时候就显得力不从心,因为两个对对方领域丝毫不了解的人,如何协作呢。
而与培养这样的全能人类一样,AGI的培养成本极高,因为所有领域之间都是相互影响的,牵一发而动全身,每多学习一点知识,就需要对整个模型的所有领域同时更新,这是相当大的工作量。
而Deepseek,在进行训练和学习新知识的时候,只需要把新的东西放到对应的那一个专家那去就好了,所以他的效率高,成本低。
那么我们明白,在执行跨学科任务(如探讨数学与哲学、物理与心理的联系)时,AGI的表现更为优越。但在特定单领域问题上,Deepseek可以通过调用相关“专家”,以更低的成本,更少的算力消耗与更优的效率实现媲美AGI的能力,甚至在重心领域(如编程)上超越AGI。
而事实上,大众对AI的需求,都是非常集中且基础的,根本用不到AGI的广度和深度。
所以deepseek利用了这一点,把资源集中,铺设在大众使用的多的领域上,写作文,数学,编程。就足以满足99%用户的需求了,对于冷门的,刁钻,跨领域的问题,反正基本也没什么人问,也没什么固定答案,就没必要投入研究那么多了。
而过去AI行业确实走歪了方向,一直做着AGI的大梦,结果只是拿给普通用户用,像开着潜艇逮鱼一样,根本没必要。Deepseek的这一次变革,会将AI市场一分两半,以后各家都会推出针对民用的低成本专精AI,而AGI嘛,说白了除了作为行业理想,到现在它的实际应用领域也没研究明白,但是deepseek这么一搞,美国投资人可不干了,以前以为只能做高投入的AGI,现在发现居然有低投入就挺好使的专精AI,投资人可精的很,他们可不管什么理想不理想,我只要低投入高回报!结果就是美国那些执着追求着AGI的人可气坏了,钱没了还追个蛋的理想,那我没事干了,给你整点网络攻击得了。
算力
算力永远是AI不可或缺的东西,决定着其上限。不可能因为程序改进就可以舍弃算力,不管做什么样的菜,你都得有锅。算力是基础,前提,也是上限,英伟达也不可能完蛋。
Deepseek策略
deepseek其实很明白在算力方面的短缺,不可能在AGI上硬碰OpenAI,更没必要去追求这么一个悬在梦里还不知道行不行的理想,所以选择了干点实际的吧,我把用户的需求做好得了,你爱拿着你那芯片研究AGI你就研究去吧,你要真研究出来了,我再跟着干。
这也是中国一贯的竞争策略,看看老美研究啥了,然后整个低成本的,先把中低端市场拿住,以量得利,逼着美国往费力不讨好的高端研发走,能捣鼓出啥创新来再跟上就是了,也不用投入,也不用试错,中低端利润还拿走了,老美费劲花钱研究点什么新方向,一有进展咱研究两天,老美还没回本呢,咱又整个低价进去了,可把老美气坏了。
在这个方向看,开源便有三个好处,
第一,开源建立民用生态,你OpenAI这么贵和有钱的玩去吧,我直接开源免费,全球独立个体,中小企业,全用我的,搭建生态的同时还能赚点全球声望,建立标准,拉拢全球开发者,基于 DeepSeek 进行二次开发,增强 DeepSeek 的影响力,抢占市场份额。
第二,自然是削减了OpenAI的声势,而且其还得不到什么好处,Deepseek开源虽说是把训练方式,架构公开了,但是都明白,美国AI企业全是奔着AGI去的,AGI最为重要的是内部联合,MoE架构OpenAI和谷歌好几年前早就都用过,但是其内部的区块化与AGI的协同要求冲突严重,就算明着知道Deepseek使用MoE的方法,OpenAI也不可能转移到这上面来,奥特曼也发文说仍会坚持原本架构。
第三,国内社会长久处于压抑之中,民众甚至感到失望,不论是deepseek的发布还是春晚机器人的转花娟,都可以提振民心,刺激股市,让民众多点信心。
最后
Deepseek并不是要与OpenAI在AGI领域硬碰,而是民用,实用领域,OpenAI在AGI领域持续投入这么多年,肯定还是有优势的,毕竟GPT-4是2023年3月发布的,这么长时间不断的更新,出了4o,OpenAI也肯定研究别的了,人聪明不聪明不管,显卡可是货真价实的,现在这些人给他戴这么高的帽,以后出点什么问题就开骂的也是这些人。
对行业来说,Deepseek把行业方向拉了回来,或者更确切的说分割了一半回来,以后市场分为这俩:
- 高成本 AGI(OpenAI、Anthropic、DeepMind)
这些公司继续追求通用人工智能,烧钱训练更大的模型,目标是做“万能 AI”。 - 低成本专精 AI(DeepSeek、Meta、开源社区)
这类公司关注具体应用,比如编程 AI、写作 AI、数学 AI,目标是做“最好用的 AI”。
DeepSeek 通过开源,可以让全球开发者都参与进来,让“专精 AI”成为行业新标准。即使 OpenAI 继续坚持 AGI,市场也会发现,并不一定需要一个无所不能的 AI,专精 AI 可能更具实用价值。
Deepseek推动了行业进步,OpenAI跟微软都必须在Deepseek生态成型前发布新产品才能稳住形式,估计也就是近几个月,GPT-5也研究了好几年了,估计这下藏不住了,就看提升多少了,就怕这个一发,有些人又开始骂deepseek。
Deepseek也确实给这些一味追求理想中的AGI的人打了一巴掌,到现在连个具体应用方向都没有,这次市场分割也逼着他们必须阐明AGI的前进方向了,微软和OpenAI也不会明着接受专精大模型的,接受等于打自己脸,但是又不能一直忽悠投资人,就只能标明自己的公司是追求AGI的,再推出两个便宜的专精民用大模型糊弄糊弄。
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
相关推荐

你 发表评论:
欢迎