当前位置：首页 > 每日看点

OpenAI 发新模型 o3 和 o4-mini，能够「思考」图片，这意味着什么？该模型有何强大之处？

卡卷网1年前 (2025-04-17)每日看点277

今天早上，简单玩了几把，在Poe上。主要测了一下常识。

o4-mini 是我见过最离谱的模型，这不是出现幻觉了，简直是幻觉本体，已经是张冠李戴了。不要用，会不幸。日用首选Gemini 2 FT/豆包，豆包幻觉比2FT高点，但知识密度更高，看你任务需求。

（我补充一下，o4-mini有中文降智的现象。）

o3速度快得离谱，我发现它没思考。表现正常，在常识方面就是一个普通模型，语言能力比Gemini 差一截。（没有全面超越Gemini 2.5 Pro）

硬任务还没测。目前，我还是最喜欢Gemini 2.5P。考虑到o3的价格，建议主力还是Gemini，如果解决不了，再尝试一下o3。

据说Gemini下周又要更新了。OpenAI真是压力山大。在Google的重压之下，OpenAI感觉已经出现了裂痕。

扫描二维码推送至手机访问。

分享给朋友：

手持荣耀20，用了五年多了，使用仍然较为流畅，但是电池不太行了，于是2024年8月在家乡的小米之家购买了小米14（12+256），用了快两个月吧，说说使用体验。外观层面，由于我使用的荣耀20放在现在妥妥地属于小屏，习惯了小屏，遂购买小米1…

最主要原因是因为——贵！看看我家里搭建的这一套吧。目前我家中有5台常用的NAS，分别为群晖DS1522+、威联通TS-464C2、绿联DX4600 Pro 、极空间Z4S、威联通TS-AI642。个人认为，这其中的每台NAS都是时代…

用上了高端的Mac（已退货）才知道：原来文件夹里面的文件，你看到是8个，其实可能有12个。其中3个图标重叠在一起了，另外一个被拖动到屏幕外面了。用上了高端的Mac（已退货）才知道：原来鼠标灵敏度有问题是因为系统内置了鼠标加速度，只能用控制…

一个完整成型的B2C电商独立站，如果用wordpress+woocommerce搭建，最终会用上20来个插件，而且是在经过慎重筛选，剔除不必要的插件的情况下，别问我为什么。 wordpress建站，插件安装多了，速度会变慢，这是常识，但需要…

题主一直比较关心神经网络在其他科学领域的应用，比如数学、物理学还有生物学，比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向，其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过…

理想的闲鱼：卖家视角：4000块钱买的手机，用了半年不想用了，挂一个3000块，和买家一顿交流，最后2500块成交，我得到了回血，买家得到了便宜；买家视角：想用一台4000块的手机，但是手里只有2500块，来到闲鱼和卖家一顿交流，最后25…