当前位置:首页 > 每日看点 > 正文内容

OpenAI 发新模型 o3 和 o4-mini,能够「思考」图片,这意味着什么?该模型有何强大之处?

卡卷网11个月前 (04-17)每日看点198

今天早上,简单玩了几把,在Poe上。主要测了一下常识。

o4-mini 是我见过最离谱的模型,这不是出现幻觉了,简直是幻觉本体,已经是张冠李戴了。 不要用,会不幸。 日用首选Gemini 2 FT/豆包,豆包幻觉比2FT高点,但知识密度更高,看你任务需求。

(我补充一下,o4-mini有中文降智的现象。)

o3速度快得离谱,我发现它没思考。表现正常,在常识方面就是一个普通模型,语言能力比Gemini 差一截。(没有全面超越Gemini 2.5 Pro)

硬任务还没测。 目前,我还是最喜欢Gemini 2.5P。考虑到o3的价格,建议主力还是Gemini,如果解决不了,再尝试一下o3。

据说Gemini下周又要更新了。OpenAI真是压力山大。在Google的重压之下,OpenAI感觉已经出现了裂痕。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12579.html

分享给朋友:

相关文章

网易云音乐里有哪些打动你的评论?

1.“如果我被强奸了,有人说我会失去贞操。”“我怎么失去贞操了呢?” “我的贞操不在我的阴道里。”“失去贞操的是强奸犯,而不是被强奸的人。”2.但要记得那年海边的烟火,我们不拘一格 ,嘲笑过生活。………网易云热评《这样就很好》3.“ 我们在...

下一个风口最可能是什么?

下一个风口最可能是什么?

肯定是一带一路了,国内没什么卷的空间了,现在国家正在给一带一路的第三世界国家建设基础设施,等交通打通之后,就是通信打通,通信打通就是贸易打通,未来我建议大家重仓小语种,阿拉伯语最值得学(也有其他小语种自己去查一带一路国家),将来去其他国家随...

荣耀magic 7 首发的应该都收到货了,感觉怎么样?

8号入手magic7,跟mate40pro比。优点:1、电池真耐用,充电块,华为电池也是新换的但是明显荣耀耐用;2、系统明显快多了,mate40pro下半年开始卡的不行,实在受不了了。3、声音、震动效果提升明显,指纹反应灵敏很多。 缺点:1...

无意中发现技术主管写的代码,大家帮忙看看什么水平?

无意中发现技术主管写的代码,大家帮忙看看什么水平?

虽然很多答主用了诸如“典范级”、“心旷神怡” 的形容, 赞美这段代码, 但这里, 出于技术讨论的动机, 我说说不同看法.栈, 如果善于利用栈来处理树结构, 那么可以写出更简洁的代码, 根本不需要 recuresiveFn 这种方法. 泛型,...

为什么雷军身上没有酒色财气?

武大建校130周年时,雷军向母校个人捐款13亿。在2023年8月14日晚上七点,雷总在国家会议中心举行的进行第四次年度演讲「成长」:全篇都在谈成长、梦想,这么多年了,始终做到了知行合一,我相信酒色财气可能真不是他所追求的,一直追求的就像他演...

国内AI大模型已近80个,哪个最有前途?

国内AI大模型已近80个,哪个最有前途?

题主说错了,不是80个,是168个!虽然“最有前途”不好说,但是我可以帮题主排除一些错误方向:开源大模型一定比闭源的有前途吗?参数量大的模型一定就比小模型有前途吗?榜单排名高的大模型一定更有前途吗?2024年3月更新,243个大模型中有哪几...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。