当前位置:首页 > 每日看点 > 正文内容

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?

卡卷网5个月前 (03-24)每日看点79

那天在技术论坛刷到T1发布的新闻,突然想起去年用某大厂AI写周报被领导说“太像机器人”的糗事。腾讯这次搞的混元T1,名字听着像修仙小说里的法宝,实际测试过的朋友说它处理代码逻辑比人类程序员还较真,连缩进不对都要念叨两句。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第1张

这模型最唬人的是那个Hybrid-Mamba-Transformer架构,名字长得能当密码用。简单说就是把处理长文本的Mamba和Transformer拼在一起,像给AI同时装燃油发动机和电动机。实际用起来,处理万字技术文档时不会像传统模型那样中途死机,反而越长的文本越来劲——有开发者开玩笑说这AI怕是得了文字饥渴症。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第2张

87.2分的MMLU-PRO成绩单看着漂亮,但圈内人都知道这分数就像手机跑分,实际用起来可能另一回事。前阵子某头部模型在测试集横扫千军,结果用户拿它写情书被吐槽“比数学老师还直男”。不过腾讯手里捏着微信、游戏这些场景,光是给游戏NPC装这套系统,估计就能让玩家体验上升两个档次。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第3张

听说鹅厂内部已经用T1给会议纪要“瘦身”,原本两小时的废话连篇能压缩成三行重点。更狠的是有团队在测试AI审核员,遇到违规内容不仅秒删,还会自动生成《网络文明公约》小作文教育用户。这种接地气的玩法,怕是其他光会写诗的AI比不了的。

现在大模型赛道挤得跟早高峰地铁似的,腾讯这招像是带了自家板凳上车——有微信生态当护城河,就算暂时跑不过头部选手,光在私域流量里打转也够吃三年。不过听说友商已经在憋“模型+硬件”的大招,下次发布会说不定能看到AI芯片配预制菜这种魔幻组合。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/12002.html

分享给朋友:

相关文章

电脑c盘哪些文件可以删除?

电脑c盘哪些文件可以删除?

电脑上的文件夹都是英文,很多朋友都不敢乱删,下面这几个文件夹里的文件,你可以放心删除。一、可删除的文件1、Backup这是一个备份文件夹,很多装机软件经常会把需要备份的东西,放在这个文件夹中。而当我们需要的软件正常保存之后,这些东西也就没有...

最让你震惊的网站有哪些?

压箱底的震惊来了,来波大的,一百个网站!这些都是我平时辛辛苦苦收集的,是真的牛逼,居然还有这种网站。1、实时地球网址:https://zoom.earth/实时图像每 10 分钟更新一次,提供风暴、天气预报、降水、火警等数据2、陕西博物馆...

拼多多百亿补贴买手机电脑等数码产品靠谱吗?

大家很多人都在问pdd百亿补贴购机靠谱吗?首先声明一下,我不是pdd的人,我只是一个普普通通混迹从事pc行业的数码玩家,我只是在评论区看到很多人都在无脑推百亿补贴,特地发一条怗子来说明一下这个东西。此怡不存在偏向引导,此站仅站在我个人角度上...

在 Kubernetes 中,Service 的实现原理是什么,它是如何实现服务发现的?

行,问的这个问题挺有意思,Kubernetes 里 Service 是怎么实现的,服务发现是怎么回事,咱就直说了。这事儿看起来挺玄乎,但掰开揉碎了讲,也就那么回事。你得把这事儿想得简单点,别一上来就被啥术语吓住了——其实全是些搬砖的套路。咱...

国内AI大模型已近80个,哪个最有前途?

国内AI大模型已近80个,哪个最有前途?

题主说错了,不是80个,是168个!虽然“最有前途”不好说,但是我可以帮题主排除一些错误方向:开源大模型一定比闭源的有前途吗?参数量大的模型一定就比小模型有前途吗?榜单排名高的大模型一定更有前途吗?2024年3月更新,243个大模型中有哪几...

领导给我介绍了私活,挣了3W。该给领导分多少合适呢?

你看,这就是网络的好处了。这种问题,你去问亲戚朋友,一大帮子人有一大帮子说法,还不排除有人眼红故意坑你瞎出主意。你这隔网上一问,大家素昧平生,反而因为想骗个赞跟你使出浑身解数来出主意。多好你看。其实这事道理很简单。人脉是人家的,活是你干的。...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。