o1、GPT4、GPT4o 这三个有什么区别?
作者:卡卷网发布时间:2024-12-04 16:23浏览数量:340次评论数量:0次
GPT-4已经无了。
GPT omni,模态全能者
GPT-4o,o代表着omni(全能),体现了OpenAI将大部分模态,统一在Transform框架下,激发模型进行全模态思考的野心。
比如S2S,比传统的TTS,多了声波的维度,你可以从声波的频率中解读出额外的信息。还有图片识别,在统一框架下的图片识别,可以更有机地调用主模型的推理能力。
GPT-4o的框架下,有小模,中模,大模三种尺寸,小模适合快速推理(其实什么都不适合,现在比较好用的小模是Flash002),中模适合大部分人的通用任务,包括数学,代码,查询差不多都在这一层,大模写作能力更好,情感理解更细腻,大模的存在并不能明显提升STEM领域的表现,但对那种规则不明确的领域,会有更好的模拟,比如写作。
OpenAI o1,推理者
这是基于GPT的新式推理框架,可以理解为一个官方的Prompts外挂,通过强化学习,让模型学会通过“Prompt自启发”来稳固展开推理流,视野更广,步子更稳,走得也更远。作为一个通过强化学习得到的模型,奖励设置是重中之重。像数学、逻辑推理,通用代码是几个容易验证,所以容易设置奖励的领域。像主观性的东西,仍依赖于传统的RLHF(或者SFT),这就非常考验项目主管的审美能力了。
从本质上讲,o1仍然属于“单体Agent推理流”,这和马文·明斯基设想的“Agents心智社会”有比较大的差距,——即“智能”是由多个Agents协作产生的,它们会符合进化论和博弈论的潜在规则。或者,简而言之,o1仍然属于弱强化学习。如果要构成了一个“Agents的推理社会”,仍然需要在强化学习多多投入。
我大体同意OpenAI的理念,从深度神经网络中能直接挖掘出来的东西看,现阶段已经告一段落了,下一个世代需要的算力和数据量,可能又是另一个级别了。
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
相关推荐

你 发表评论:
欢迎