当前位置:首页 > 每日看点

为什么BAT没做出DeepSeek?

卡卷网1年前 (2025-04-05)每日看点246

阿里在这件事里绝对是最冤的那个。

当时Qwen2.5霸榜了openllm好久,夸张到Best XXX Model从0.5B的到70B的清一色全都是Qwen2.5。

现在随便翻进一个rank(openllm,只有开源模型):

为什么BAT没做出DeepSeek?  第1张

看起来百花齐放是吧?然而事实上是点进去看看前十名都TM是Qwen2.5 72B上finetune的。

你再随便翻进另一个rank(arena hard)

为什么BAT没做出DeepSeek?  第2张

这个有点老了,第一个开源模型也是Qwen72b finetune出来的。

你再随便翻进一个rank(live bench),这个很新,上面甚至有R1/V3。R1/V3之后的开源模型就是Qwen72b给finetune出来的。

之后阿里的创新能力就严重不足了,悲。事实上Deepseek发了一个R1一个V3,之后又有好几个版本finetune的qwen,为什么他发布的是 为什么BAT没做出DeepSeek?  第3张 distill的qwen不是其他模型(像llama)?肯定是有}理由的啊。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12282.html

分享给朋友:

相关文章

开发了个小程序,咋推广呢?

要是开发了个小程序,想推广的话,可以先从自己的朋友圈子下手,让亲戚朋友都帮忙转发宣传,这样能先有点人气。 然后去一些跟你的小程序相关的论坛、社区啥的,发帖子介绍介绍,吸引有兴趣的人。 还能找些网红、博主合作,要是他们觉得你的小程序不错,帮忙…

大量刷短视频,会让大脑变笨拙吗?

会。 我曾经是一名高三学生,亲身实践过。 当时集中突破语文,每天都在刷语文卷。然后有一天想躺一下刷手机,结果短视频刷完了,我再去看哪些文章,只觉头晕眼花,难以理解文字。不过好在这种情况是短时间的,过了一天我的能力又恢复了。 在我看来,长期刷…

中国芯片产量达1399亿颗,这意味着什么?

美国并不是没有明白人,只是特朗普不懂芯片产业的情况,冒冒失失在ZZ正确下,开启了对中国芯片的掐脖子,结果没掐死,反而让人练出了铁肺。 芯片是所有科技产业的上游,美国原本在上游呆得很舒服,靠英伟达、AMD、德州仪器、高通等这些几十年霸主地位的…

荣耀magic 7 首发的应该都收到货了,感觉怎么样?

8号入手magic7,跟mate40pro比。 优点:1、电池真耐用,充电块,华为电池也是新换的但是明显荣耀耐用;2、系统明显快多了,mate40pro下半年开始卡的不行,实在受不了了。3、声音、震动效果提升明显,指纹反应灵敏很多。 缺点:…

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了 惠普z230sff薄塔 cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g 显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显 内存是加到16…

程序员都有自己的服务器吗?

程序员都有自己的服务器吗?

2024.9. 24,有朋友咨询功耗,我没有单独给服务器弄智能插座,系统做的 esxi 也看不到,所以只能用其他角度判断供大家参考。 我有一个餐边柜改的机柜,里面白裙两盘,黑群晖 4 机械 1 mvme,一个爱快硬路由,一个联通光猫,一个…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。