当前位置：首页 >> 每日看点 >> o1、GPT4、GPT4o 这三个有什么区别？

o1、GPT4、GPT4o 这三个有什么区别？

卡卷网 2024-12-04 16:23:36 每日看点 394

GPT-4已经无了。

GPT omni，模态全能者

GPT-4o，o代表着omni(全能)，体现了OpenAI将大部分模态，统一在Transform框架下，激发模型进行全模态思考的野心。

比如S2S，比传统的TTS，多了声波的维度，你可以从声波的频率中解读出额外的信息。还有图片识别，在统一框架下的图片识别，可以更有机地调用主模型的推理能力。

GPT-4o的框架下，有小模，中模，大模三种尺寸，小模适合快速推理（其实什么都不适合，现在比较好用的小模是Flash002），中模适合大部分人的通用任务，包括数学，代码，查询差不多都在这一层，大模写作能力更好，情感理解更细腻，大模的存在并不能明显提升STEM领域的表现，但对那种规则不明确的领域，会有更好的模拟，比如写作。

OpenAI o1，推理者

这是基于GPT的新式推理框架，可以理解为一个官方的Prompts外挂，通过强化学习，让模型学会通过“Prompt自启发”来稳固展开推理流，视野更广，步子更稳，走得也更远。作为一个通过强化学习得到的模型，奖励设置是重中之重。像数学、逻辑推理，通用代码是几个容易验证，所以容易设置奖励的领域。像主观性的东西，仍依赖于传统的RLHF（或者SFT），这就非常考验项目主管的审美能力了。

从本质上讲，o1仍然属于“单体Agent推理流”，这和马文·明斯基设想的“Agents心智社会”有比较大的差距，——即“智能”是由多个Agents协作产生的，它们会符合进化论和博弈论的潜在规则。或者，简而言之，o1仍然属于弱强化学习。如果要构成了一个“Agents的推理社会”，仍然需要在强化学习多多投入。

我大体同意OpenAI的理念，从深度神经网络中能直接挖掘出来的东西看，现阶段已经告一段落了，下一个世代需要的算力和数据量，可能又是另一个级别了。