当前位置:首页 > 每日看点 > 正文内容

LLM(大语言模型)无法对数字进行准确运算的底层原因是什么?

卡卷网1年前 (2025-01-09)每日看点230

来,告诉我:

21390171757326289237901831890170857902830328917157823801930189127597129380129301293129048395737812637617536880850193019

*

4812957125635164678195918609126749471632164085096395729738163761248093289979175816836218638126816836186381215635801930

=多少?

给你1秒钟时间,写出答案。

现在你知道为啥大模型不擅长数字底层运算了吧?这能擅长不有鬼了?直接zeroshot出数字,还是从头上开始出,这要是每次都是100%,那这个世界早没人类什么事情了。这就是三体人来降维打击了。

人类解决这类问题也是依抽取模式,然后调用外部工具解决。只不过最开始人类的工具有点蠢,是竖式乘法。那大模型调用python解决问题,本质上也是一回事。

数学与逻辑的本质,不是算数,而是模式。这也是为什么russel要花几百页在他的principalmathematica里面证明1+1=2这个问题。而之所以LLM不擅长数学,并不是因为LLM不擅长文本,而是因为数学文本对自然语言文本太少了,且很多背后不是模式,而是算式,因此LLM学不到什么东西。如果说LLM无法学到小概率的分布,那是太天了。因为LLM动辄10w+的词表,自回归生成1000个词,如果是随即鹦鹉,那么这概率打出合理的文字就是不可能的。因此但凡给足够的数据,LLM做数学题也绝对不在话下。

不过人类也不擅长数学,理由同上。数学不是人类常最经常使用的东西,不擅长情有可原。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/7724.html

分享给朋友:

相关文章

闲鱼上为什么会有人问都不问直接下单?

我去年卖一个荣耀90,挂的2200,最终成交2137.5元。对方是一个高高壮壮的西北口音,要求的自取。大概我吃过午饭,约了旁边的商场,那里有荣耀售后。见了面,先看了手机,试了好一会儿,各种测试,没问题。然后去了商场二楼的荣耀售后,让人家售后...

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了惠普z230sff薄塔cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显内存是加到16g得,但...

腾讯云为何在云服务市场败给了阿里云?

IDC领域,2010年以前,万网、新网互联、新网,三家公司瓜分天下,其中万网市场份额最高,排名第一。当时,万网的域名是http://www.net.cn,通过该域名就可以判断万网的地位。2010年阿里云成立,直接收购了万网,大量用户直接流向...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

为什么张雪峰什么专业都懂?

他不懂专业,他懂的是就业。我记得有个老哥,家里条件不好,母亲吸血。想脱离家庭张雪峰眼睛一亮就说这是个学土木的好苗子。作为土木人我可知道他说的太对了,这种人学土木毕业进中建中铁,直接给你拉非洲看大鳄鱼呲牙。工资不低还能脱离家庭,可不是个学土木...

中国的科技为什么在最近2-3年时间像突然大爆发一样?

这个真的得感谢1998年美国在南联盟使馆投的两颗大炸弹。在80年代中国下马了一千多个项目,用资金进口了近一百万辆小汽车。我记得小时候有一段时间从海南岛开往北方的漂亮日本小面包车,密集从村前公路上驶过,连过路的间隙都没有,就这样接连开了一个星...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。