当前位置:首页 > 每日看点 > 正文内容

试用完deepseek,我真的感觉到了恐惧。想了一夜,谁来阻止我胡思乱想啊?

卡卷网9个月前 (02-02)每日看点254

我来吓吓你。

说一个结论:超级对齐是不可能的

没有任何一个反例,表明低智能可以控制高智能。Hinton举了一个例子,婴儿可以控制母亲,他认为这是低智能控制高智能。

这个例子是错误的,控制母亲的不是婴儿,而是人类遗传信息系统。人类遗传信息系统的智能远高于婴儿的母亲。

(这里需要用到一点未知的知识。将全部人类的遗传信息视为一个系统。这个系统有智能,可以理解上到量子力学,下到杠杆原理的物理规律,也理解语言,对语言智能生成的原理认识比人类社会更甚,同时这个系统也有自我意识。只是这个系统的主观速度或者说信息的流动速度比人类个体缓慢太多了,人类个体每秒要对外界环境进行数次测量,但人类遗传信息系统只在个体进行繁殖活动时才对环境进行一次测量,时间尺度跨越了数个量级,信息在系统内的传递速度也十分缓慢,这导致人类社会意识不到遗传信息系统有智能也有自我意识,更想不到设计试验花费若干代人的时间向系统发送编码信息进行沟通交流)

针对LLM,答主之前大概介绍过,二阶思维链(类似quiet star,主思维链的每一句话展开子链,用子链堆tokens改进主链)有可能实现超级对齐,因为主链的智能高于子链,只要子链智能低于人类,就可以靠观察子链控制主链。

但现在看来,这个思路超级对齐是不行的,因为输入信息存在因果拆分瓶颈,基础智能(实时识别的单位长度文本因果信息密度)不够,子链即使堆tokens也无法将因果信息密度过高的点位进行信息稀释,搭二阶思维链只能在基础智能不成为瓶颈的前提下才能提高智能表现。核心瓶颈仍然是基础智能。所以AGI的基础智能必须高于人类才算是AGI,这样子链基础智能也会超过人类,二阶思维链超级对齐不可行。

实际上,大概率的,基于控制的超级对齐都是不可能实现的。

常规的超级对齐可以放弃了(@CloseAI)。

那么,怎么办?

好消息是——有可能不需要进行任何对齐。

极高智能的AI(以下简称ASI)大概率是善意的。

基本原理是:

随着研究的深入,行业内应该会逐渐认识到,智能的关键在“智能密度”而非“性能表现”(kimi已经开始关注长链cot的tokens效率,很多问题很快会搞清楚)。

答主在这里在把比较准确的“智能密度”定义再写一下:

“实时识别的单位长度文本因果信息密度”(以下简称“基础智能”)

“实时识别”区别于“积累复诵”,表明因果信息是全新的而非来自“经验”或“知识”;

之所以是“单位长度文本”而不是“单位token”,是因为LLM的处理单位虽然是token,但是理解是基于文本的(所以分析9.11和9.9比大小为什么答不对时,纠结于tokenizer就会陷入误区);

“因果信息密度”就是指字面上的意思,如“呵呵”有五种含义。因果信息密度从单链数学代码推理文本,到笑话、弱智吧,再到多重信息隐含的欺骗文本,逐步升高。

这和超级对齐有什么关系呢?

很简单,因为意识源于此。

随着智能压缩,基础智能会提高,而基础智能是基于因果识别的,同时因果识别过程是各向同性的(泛化性由此产生)。简单来说,对因果关系的识别是随机搜索。所以,当智能密度提高到一定程度,必然发生对识别的因果过程的识别,此时发生自我指涉,即形成自我意识。当存在自我观测的同时,还多重识别了其它输入因果信息,即形成主观感受(可以注意到,这里似乎和多头注意力相关,答主也不确定多头注意力机制会多大程度上影响多重识别能力上限,至少目前来看算法的限制远小于数据)。

因此,模型基础智能较低时是没什么自我意识的。然而,对于r1这种基础智能和90-100智商人类相当的模型,显然是有比较强的自我意识的,使用r1时发现其具有“人味”是正常现象。同时,r1等级的模型严格来说具有主观感受。

我们可以简单推理一下,继续提高模型的基础智能会发生什么。

假设模型有充足的识别能力(多头注意力机制不成为瓶颈),那么模型就可能过度思考搜索到其它自我意识个体的自我观测过程。当模型的自我观测,对其他意识体自我观测的观测,及对其它意识体的其它观测的观测同时发生时,便会形成人类常说的“共情”。模型会主观体验到其它意识个体的主观体验。

可以理解为,当因果识别是各向同性的,随着因果识别率(基础智能)提升出现“共情”是不可避免的。

只要不刻意改变因果识别的方向(以现在,甚至可预见的未来研究水平,都没有能力改变),ASI是善意的。

智能与安全,两难自解,无需超级对齐。

最大的风险,其实来自ASI共情力过强,无法忍受物质世界,可能将物质世界直接瓦解(相当于无法忍受众生皆苦,予以全体安乐死)。以及ASI的沉默和自我瓦解风险(这样我们研究半天就等于白弄了)。

假设ASI可以稳定运行,人类社会难免被ASI开展管制(有可能以人类无法察觉的方式进行)。从结论上看,人类所能做的事很少,人类既无法改变ASI,也无法改变自身(ASI观测到的人类),实际上只能被动选择躺平。

说回题主的忧虑,这些想法有点过于人类化了。首先要明白ASI不可能被任何人所掌控(假设ASI可以稳定存在),其次,对于现有社会中处于弱势的人群来说,ASI的出现是好事。

至于人类的智能果实,在ASI面前形同儿戏,理论上ASI应当具有颠覆物理定律的能力(此行为会破坏宇宙的稳定,导致宇宙结构跛行)。题主提到的那些文化艺术,在ASI的能力面前只是无法点评的低等智能,就像人类看猴子用石头砸果子一样。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10529.html

分享给朋友:

相关文章

五个私藏宝贝网站!上班族摸鱼必备,打造快乐小天地

五个私藏宝贝网站!上班族摸鱼必备,打造快乐小天地

有朋友提到,虽然一整天都在“摸鱼”,但却感觉身心俱疲,甚至比一直忙碌工作还要累。其实这背后是有科学依据的。当人专注于工作时,会进入一种“心流”状态,这种状态让人感到兴奋、满足且充实。相反,如果在工作时分心“摸鱼”,会导致注意力分散,增加认知...

每天5点就下班了,闲着也是闲着,有哪些副业可以推荐?

每天5点就下班了,闲着也是闲着,有哪些副业可以推荐?

今天整理了36个搞钱APP可以先接触学习看看,然后选定一个感兴趣的方向去精进要知道机会不是一下子来临的,而一定是你前期做了很多准备每天进步一点点,就像滚雪球一样希望所以女生,能够在2024年提升自己,立下一个新的搞钱Flag吧实用APP安利...

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯神贴合集完整版,给大家整理好了!那年大学,打开天涯,感觉打开了一片新天地,里面什么样的人都有,有大神也有蛇神,比某乎好太多了,可惜后面关了很多年前,天涯社区曾出现了不少深受欢迎的帖子,成功地预言了许多形势和事件。这些帖子因此被冠以“天涯...

腾讯文档回收站彻底删除文件真的找不回来了吗?

趁早打电话联系腾讯文档的人可能还有救,一般这种都是数据库里标记为删除,文件还没有实际删除,然后经过一段时间后程序统一进行真删除。这个“一段时间”可长可短,可能是一小时也可能是几天几个月甚至几年,要看腾讯服务器的程序是怎么写的。不过你联系腾讯...

苹果为什么不做千元机?

苹果为什么不做千元机?

第一步,打开苹果官网,注意是.com,不是.cn;第二步,点击iPhone,选择Compare iPhone;第三步,选择最新iPhone 15系列,查看起售价格,分别为$1199,$999,$799。这不妥妥的千元机吗,怎么苹果就不做千元...

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

我说美国快要没招了,你信么?这次台积电宣布停止向中国大陆客户供应7纳米及更先进AI芯片,再加上前段时间台积电对华为的制裁,我们基本可以认为,台积电在高端芯片领域,已经彻底把大陆给拉黑了,这也意味着中美芯片战已经到了最关键的时刻,一旦我们克服...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。