当前位置:首页 > 每日看点 > 正文内容

为什么BAT没做出DeepSeek?

卡卷网8个月前 (04-05)每日看点162

阿里在这件事里绝对是最冤的那个。

当时Qwen2.5霸榜了openllm好久,夸张到Best XXX Model从0.5B的到70B的清一色全都是Qwen2.5。

现在随便翻进一个rank(openllm,只有开源模型):

为什么BAT没做出DeepSeek?  第1张

看起来百花齐放是吧?然而事实上是点进去看看前十名都TM是Qwen2.5 72B上finetune的。

你再随便翻进另一个rank(arena hard)

为什么BAT没做出DeepSeek?  第2张

这个有点老了,第一个开源模型也是Qwen72b finetune出来的。

你再随便翻进一个rank(live bench),这个很新,上面甚至有R1/V3。R1/V3之后的开源模型就是Qwen72b给finetune出来的。

之后阿里的创新能力就严重不足了,悲。事实上Deepseek发了一个R1一个V3,之后又有好几个版本finetune的qwen,为什么他发布的是 为什么BAT没做出DeepSeek?  第3张 distill的qwen不是其他模型(像llama)?肯定是有}理由的啊。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12282.html

分享给朋友:

相关文章

你是如何在不依靠工资收入的情况下赚到一万元的?

你是如何在不依靠工资收入的情况下赚到一万元的?

分享几个路子稳,门槛低,变现快,适合年轻人的靠谱的副业。绝对不是送外卖、滴滴、搬砖等等的苦力活,这几个副业都是能是性价比极高,还能让你快速成长的工作。想通过副业实现暴富、立马月入过万的同学,建议速速划走。今天撇哥就给大家分享100+个靠谱赚...

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了惠普z230sff薄塔cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显内存是加到16g得,但...

面试官问“你的SQL能力怎么样?”时应该如何回答?

面试官问“你的SQL能力怎么样?”时应该如何回答?

如果面试时被问你SQL能力怎么样?要么是考查一下题目,怎么写SQL语句。要么是问SQL优化相关的,更容易问出一个人的水平。sql优化是一个大家都比较关注的热门话题,无论你在面试,还是工作中,都很有可能会遇到。如果某天你负责的某个线上接口,出...

我怎么也无法理解网络游戏为什么会有外挂?

我怎么也无法理解网络游戏为什么会有外挂?

因为你把服务器想象成了无所不能的上帝;但在我们程序猿眼里,服务器不过是一个黑大傻粗的计算器。比如说,我们在某个位置打开一个宝箱:那么,你觉得,程序背后应该做了些什么呢?一、天真的玩法天真的程序猿会觉得,啊,这事简单!我就告诉服务器,用户ID...

做一名网络工程师是什么体验?

做一名网络工程师是什么体验?

过地铁火车安检时,经常会被要求开包检查。。。同时,电脑包的重量普遍比较高。除了很多打工人必备的笔记本电脑之外,网络工程师还会随身携带部分工具。。。01.网线(长度不一定,根据工作要求随时被使用。。。)没有网线无法开展工作。02.串口线,ty...

苏宁是怎么堕落的?

苏宁是怎么堕落的?

张近东终究还是要为自己得鲁莽买单,如今的苏宁大不如前,甚至是大势已去。记得刘强东曾经说过:一成不变的人很难有出路,更何况做企业的老板。别看如今传统行业表面风光无限,背地里早已经千疮百孔!任何一家民营企业如果不做出改变,依旧在原地踏步,等待的...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。