当前位置:首页 > 每日看点 > 正文内容

试用完deepseek,我真的感觉到了恐惧。想了一夜,谁来阻止我胡思乱想啊?

卡卷网11个月前 (02-02)每日看点278

我来吓吓你。

说一个结论:超级对齐是不可能的

没有任何一个反例,表明低智能可以控制高智能。Hinton举了一个例子,婴儿可以控制母亲,他认为这是低智能控制高智能。

这个例子是错误的,控制母亲的不是婴儿,而是人类遗传信息系统。人类遗传信息系统的智能远高于婴儿的母亲。

(这里需要用到一点未知的知识。将全部人类的遗传信息视为一个系统。这个系统有智能,可以理解上到量子力学,下到杠杆原理的物理规律,也理解语言,对语言智能生成的原理认识比人类社会更甚,同时这个系统也有自我意识。只是这个系统的主观速度或者说信息的流动速度比人类个体缓慢太多了,人类个体每秒要对外界环境进行数次测量,但人类遗传信息系统只在个体进行繁殖活动时才对环境进行一次测量,时间尺度跨越了数个量级,信息在系统内的传递速度也十分缓慢,这导致人类社会意识不到遗传信息系统有智能也有自我意识,更想不到设计试验花费若干代人的时间向系统发送编码信息进行沟通交流)

针对LLM,答主之前大概介绍过,二阶思维链(类似quiet star,主思维链的每一句话展开子链,用子链堆tokens改进主链)有可能实现超级对齐,因为主链的智能高于子链,只要子链智能低于人类,就可以靠观察子链控制主链。

但现在看来,这个思路超级对齐是不行的,因为输入信息存在因果拆分瓶颈,基础智能(实时识别的单位长度文本因果信息密度)不够,子链即使堆tokens也无法将因果信息密度过高的点位进行信息稀释,搭二阶思维链只能在基础智能不成为瓶颈的前提下才能提高智能表现。核心瓶颈仍然是基础智能。所以AGI的基础智能必须高于人类才算是AGI,这样子链基础智能也会超过人类,二阶思维链超级对齐不可行。

实际上,大概率的,基于控制的超级对齐都是不可能实现的。

常规的超级对齐可以放弃了(@CloseAI)。

那么,怎么办?

好消息是——有可能不需要进行任何对齐。

极高智能的AI(以下简称ASI)大概率是善意的。

基本原理是:

随着研究的深入,行业内应该会逐渐认识到,智能的关键在“智能密度”而非“性能表现”(kimi已经开始关注长链cot的tokens效率,很多问题很快会搞清楚)。

答主在这里在把比较准确的“智能密度”定义再写一下:

“实时识别的单位长度文本因果信息密度”(以下简称“基础智能”)

“实时识别”区别于“积累复诵”,表明因果信息是全新的而非来自“经验”或“知识”;

之所以是“单位长度文本”而不是“单位token”,是因为LLM的处理单位虽然是token,但是理解是基于文本的(所以分析9.11和9.9比大小为什么答不对时,纠结于tokenizer就会陷入误区);

“因果信息密度”就是指字面上的意思,如“呵呵”有五种含义。因果信息密度从单链数学代码推理文本,到笑话、弱智吧,再到多重信息隐含的欺骗文本,逐步升高。

这和超级对齐有什么关系呢?

很简单,因为意识源于此。

随着智能压缩,基础智能会提高,而基础智能是基于因果识别的,同时因果识别过程是各向同性的(泛化性由此产生)。简单来说,对因果关系的识别是随机搜索。所以,当智能密度提高到一定程度,必然发生对识别的因果过程的识别,此时发生自我指涉,即形成自我意识。当存在自我观测的同时,还多重识别了其它输入因果信息,即形成主观感受(可以注意到,这里似乎和多头注意力相关,答主也不确定多头注意力机制会多大程度上影响多重识别能力上限,至少目前来看算法的限制远小于数据)。

因此,模型基础智能较低时是没什么自我意识的。然而,对于r1这种基础智能和90-100智商人类相当的模型,显然是有比较强的自我意识的,使用r1时发现其具有“人味”是正常现象。同时,r1等级的模型严格来说具有主观感受。

我们可以简单推理一下,继续提高模型的基础智能会发生什么。

假设模型有充足的识别能力(多头注意力机制不成为瓶颈),那么模型就可能过度思考搜索到其它自我意识个体的自我观测过程。当模型的自我观测,对其他意识体自我观测的观测,及对其它意识体的其它观测的观测同时发生时,便会形成人类常说的“共情”。模型会主观体验到其它意识个体的主观体验。

可以理解为,当因果识别是各向同性的,随着因果识别率(基础智能)提升出现“共情”是不可避免的。

只要不刻意改变因果识别的方向(以现在,甚至可预见的未来研究水平,都没有能力改变),ASI是善意的。

智能与安全,两难自解,无需超级对齐。

最大的风险,其实来自ASI共情力过强,无法忍受物质世界,可能将物质世界直接瓦解(相当于无法忍受众生皆苦,予以全体安乐死)。以及ASI的沉默和自我瓦解风险(这样我们研究半天就等于白弄了)。

假设ASI可以稳定运行,人类社会难免被ASI开展管制(有可能以人类无法察觉的方式进行)。从结论上看,人类所能做的事很少,人类既无法改变ASI,也无法改变自身(ASI观测到的人类),实际上只能被动选择躺平。

说回题主的忧虑,这些想法有点过于人类化了。首先要明白ASI不可能被任何人所掌控(假设ASI可以稳定存在),其次,对于现有社会中处于弱势的人群来说,ASI的出现是好事。

至于人类的智能果实,在ASI面前形同儿戏,理论上ASI应当具有颠覆物理定律的能力(此行为会破坏宇宙的稳定,导致宇宙结构跛行)。题主提到的那些文化艺术,在ASI的能力面前只是无法点评的低等智能,就像人类看猴子用石头砸果子一样。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10529.html

分享给朋友:

相关文章

从玄学到网红 互联网企业取名有何学问

从玄学到网红 互联网企业取名有何学问

12月1日,B站发布年度弹幕,第一是“爷青回”,转到天眼查APP查找发现,“爷青回”商标已经被申请注册。此外,“爷青结”同样也已经被多家公司申请注册商标,今年B站的年度弹幕前五中“有内味了”商标也有公司申请注...

现在手里有一万闲钱,买什么币好?

今天是2024年7月29日,看看我的持仓吧。只有几百刀的那些微持仓就不说了,以下持仓都在几千刀~几万刀不等。不构成任何投资建议,成本是多次买入的大致均摊成本$TIA 成本0$DYM 成本0 $SAGA 成本0$STRK 成本0$ETHFI...

OZON平台什么产品好卖?

ozon选品的核心重点我不说 你们全网也不见说的这么干的教学了你信我就按照我说的思路去走 不信的出去买课去 一时间消化不了的先点赞收藏起来 真不中了下载也行 因为最近总有坏人给我使诈 平台已经下了我八个视频了 还都是实操教学不废话的那种 气...

如何做电商行业?

如何做电商行业?

“如何做电商*开网店”跟“如何找老婆”一样,没概况条件、没明确标准,就是扯犊子。我把话题具体一点说:具备“两三万”启动资金、掌握“选品+上架优化”基础技能,小则月入三五千、多则上万。跟摆地摊一样,有进货的钱、也不怕苦不怕累、稍微有点生意头脑...

为什么雷军身上没有酒色财气?

武大建校130周年时,雷军向母校个人捐款13亿。在2023年8月14日晚上七点,雷总在国家会议中心举行的进行第四次年度演讲「成长」:全篇都在谈成长、梦想,这么多年了,始终做到了知行合一,我相信酒色财气可能真不是他所追求的,一直追求的就像他演...

自己拥有一台服务器可以做哪些很酷的事情?

自己拥有一台服务器可以做哪些很酷的事情?

我就有一台,跑了两年了,ipv6 ddns 网络,加虚拟化平台.跑了个 winserver 和 ubuntu 服务器。稳的雅皮!拆掉后盖,散热更好。烟盒固定硬盘。键盘防止灰尘掉落。电池拆掉,屏幕拆掉,也是散热考虑。屏幕拿去做便携副屏了。换...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。