当前位置:首页 > 每日看点 > 正文内容

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?

卡卷网7个月前 (03-24)每日看点112

那天在技术论坛刷到T1发布的新闻,突然想起去年用某大厂AI写周报被领导说“太像机器人”的糗事。腾讯这次搞的混元T1,名字听着像修仙小说里的法宝,实际测试过的朋友说它处理代码逻辑比人类程序员还较真,连缩进不对都要念叨两句。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第1张

这模型最唬人的是那个Hybrid-Mamba-Transformer架构,名字长得能当密码用。简单说就是把处理长文本的Mamba和Transformer拼在一起,像给AI同时装燃油发动机和电动机。实际用起来,处理万字技术文档时不会像传统模型那样中途死机,反而越长的文本越来劲——有开发者开玩笑说这AI怕是得了文字饥渴症。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第2张

87.2分的MMLU-PRO成绩单看着漂亮,但圈内人都知道这分数就像手机跑分,实际用起来可能另一回事。前阵子某头部模型在测试集横扫千军,结果用户拿它写情书被吐槽“比数学老师还直男”。不过腾讯手里捏着微信、游戏这些场景,光是给游戏NPC装这套系统,估计就能让玩家体验上升两个档次。

腾讯混元自研深度思考模型 T1 正式发布,它有什么特点?能在大模型领域占据一席之地吗?  第3张

听说鹅厂内部已经用T1给会议纪要“瘦身”,原本两小时的废话连篇能压缩成三行重点。更狠的是有团队在测试AI审核员,遇到违规内容不仅秒删,还会自动生成《网络文明公约》小作文教育用户。这种接地气的玩法,怕是其他光会写诗的AI比不了的。

现在大模型赛道挤得跟早高峰地铁似的,腾讯这招像是带了自家板凳上车——有微信生态当护城河,就算暂时跑不过头部选手,光在私域流量里打转也够吃三年。不过听说友商已经在憋“模型+硬件”的大招,下次发布会说不定能看到AI芯片配预制菜这种魔幻组合。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/12002.html

分享给朋友:

相关文章

支付宝碰一碰市场如何?

支付宝碰一碰市场如何?

今年,支付宝又整了新的大活,即无须扫码即能完成支付操作的“支付宝碰一碰”正式登场。下面就来给大家分析分析,这是个什么情况,为什么都在说能赚钱。支付宝碰一下怎么赚钱的?都有谁能赚到这份钱?1.支付宝碰一下原理支付宝碰一下的本质依旧是“条码支付...

网页上的视频怎么下载呀?

网页上的视频怎么下载呀?

1、贝贝BiliBili - B站视频下载https://xbeibeix.com/api/bilibili/贝贝BiliBili 是个免费、免登录的bilibili视频下载工具,没有任何套路。把视频链接粘贴进去 → 输入验证码 → 解析视...

打印速度慢,是不是打印机cpu不行?

打印速度慢,是不是打印机cpu不行?

打印机是机械设备,cpu内存硬盘它也有但这只是它的电控部分,打印机类似于汽车属于机电一体化设备和电脑不是一个类型的产品。很多人总是认为打印机和电脑是一类产品,实际上这是一个误区,电脑是it(Information Technology)信息...

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了惠普z230sff薄塔cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显内存是加到16g得,但...

如何看待台积电,三星相继停供大陆7nm及更先进芯片?

在这个事出来之前,我就看到过一个说法,两家Foundry可以在中东建厂,让中东的Fab去干“脏活”。本质上是国内企业搞几个中东的代理人,装作是中东的初创Fabless企业去下单,人家Foundry大概率睁一只眼闭一只眼,只管数钱。然而,紧接...

程序员都有自己的服务器吗?

程序员都有自己的服务器吗?

2024.9. 24,有朋友咨询功耗,我没有单独给服务器弄智能插座,系统做的 esxi 也看不到,所以只能用其他角度判断供大家参考。我有一个餐边柜改的机柜,里面白裙两盘,黑群晖 4 机械 1 mvme,一个爱快硬路由,一个联通光猫,一个 2...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。