当前位置:首页 > 每日看点 > 正文内容

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?

卡卷网11个月前 (03-24)每日看点167

那天在技术论坛刷到T1发布的新闻,突然想起去年用某大厂AI写周报被领导说“太像机器人”的糗事。腾讯这次搞的混元T1,名字听着像修仙小说里的法宝,实际测试过的朋友说它处理代码逻辑比人类程序员还较真,连缩进不对都要念叨两句。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第1张

这模型最唬人的是那个Hybrid-Mamba-Transformer架构,名字长得能当密码用。简单说就是把处理长文本的Mamba和Transformer拼在一起,像给AI同时装燃油发动机和电动机。实际用起来,处理万字技术文档时不会像传统模型那样中途死机,反而越长的文本越来劲——有开发者开玩笑说这AI怕是得了文字饥渴症。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第2张

87.2分的MMLU-PRO成绩单看着漂亮,但圈内人都知道这分数就像手机跑分,实际用起来可能另一回事。前阵子某头部模型在测试集横扫千军,结果用户拿它写情书被吐槽“比数学老师还直男”。不过腾讯手里捏着微信、游戏这些场景,光是给游戏NPC装这套系统,估计就能让玩家体验上升两个档次。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第3张

听说鹅厂内部已经用T1给会议纪要“瘦身”,原本两小时的废话连篇能压缩成三行重点。更狠的是有团队在测试AI审核员,遇到违规内容不仅秒删,还会自动生成《网络文明公约》小作文教育用户。这种接地气的玩法,怕是其他光会写诗的AI比不了的。

现在大模型赛道挤得跟早高峰地铁似的,腾讯这招像是带了自家板凳上车——有微信生态当护城河,就算暂时跑不过头部选手,光在私域流量里打转也够吃三年。不过听说友商已经在憋“模型+硬件”的大招,下次发布会说不定能看到AI芯片配预制菜这种魔幻组合。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/12002.html

分享给朋友:

相关文章

互联网时代,四川为什么要办书展?

互联网时代,四川为什么要办书展?

 2004年,实体书店还是人们买书的唯一渠道,国内的书业会展旨在为出版社与发行商提供订货平台。因此,直面读者、汇集全国各地出版社新书的上海书展一经推出,便引发购书热潮。   15年之后的20...

下班后可以做点什么副业赚钱呢?

下班后可以做点什么副业赚钱呢?

首先说明一下,我分享的任务不需要交钱,也不需要入群,只需要你去平台学习就可以。如果有任何让你交钱,进群的任务,请警惕被割韭菜。今天给大家分享7大赚钱副业,新手小白0粉丝0门槛0技术都可以去做,不说大富大贵,但是赚个零花钱还是可以。如果你已经...

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯神贴合集完整版,给大家整理好了!那年大学,打开天涯,感觉打开了一片新天地,里面什么样的人都有,有大神也有蛇神,比某乎好太多了,可惜后面关了很多年前,天涯社区曾出现了不少深受欢迎的帖子,成功地预言了许多形势和事件。这些帖子因此被冠以“天涯...

PHP承载百万/天 访问量需要用到什么技术?

当年做一个百万PV的商城,也不过是两台2c4g的阿里云虚机罢了(其实一台就够,另外一台主要的逼着大家一定开发的时候一定要有负载均衡和横向扩容的意识)。当时框架还是Thinkphp3.2,框架提高运行效率的开关全打开,标准的lnmp模式,单机...

有哪些让你目瞪口呆的 Bug ?

有哪些让你目瞪口呆的 Bug ?

成都有个监狱情况比较特殊,关押的基本全是重犯,而且还都是经济犯和政治犯,他们以前都是一方大佬,在自己的一亩三分地翻手为云覆手为雨,无非是不小心中箭落马或帮老大顶锅才进监狱,所以即使进来了,他们依然保持着体面和骄傲,依从性差,虽然不至于和监狱...

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

雷总不是说了吗,我可以不用,但你不能没有。市面上OPPO Find X8 Pro和vivo X200 Pro的卫星通信版分别加价300,而荣耀Magic7和Magic7 Pro有卫星通信版且不加价,荣耀更显诚意。我觉得有是更好的,虽然使用卫...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。