当前位置:首页 > 每日看点 > 正文内容

LLM(大语言模型)无法对数字进行准确运算的底层原因是什么?

卡卷网12个月前 (01-09)每日看点179

来,告诉我:

21390171757326289237901831890170857902830328917157823801930189127597129380129301293129048395737812637617536880850193019

*

4812957125635164678195918609126749471632164085096395729738163761248093289979175816836218638126816836186381215635801930

=多少?

给你1秒钟时间,写出答案。

现在你知道为啥大模型不擅长数字底层运算了吧?这能擅长不有鬼了?直接zeroshot出数字,还是从头上开始出,这要是每次都是100%,那这个世界早没人类什么事情了。这就是三体人来降维打击了。

人类解决这类问题也是依抽取模式,然后调用外部工具解决。只不过最开始人类的工具有点蠢,是竖式乘法。那大模型调用python解决问题,本质上也是一回事。

数学与逻辑的本质,不是算数,而是模式。这也是为什么russel要花几百页在他的principalmathematica里面证明1+1=2这个问题。而之所以LLM不擅长数学,并不是因为LLM不擅长文本,而是因为数学文本对自然语言文本太少了,且很多背后不是模式,而是算式,因此LLM学不到什么东西。如果说LLM无法学到小概率的分布,那是太天了。因为LLM动辄10w+的词表,自回归生成1000个词,如果是随即鹦鹉,那么这概率打出合理的文字就是不可能的。因此但凡给足够的数据,LLM做数学题也绝对不在话下。

不过人类也不擅长数学,理由同上。数学不是人类常最经常使用的东西,不擅长情有可原。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/7724.html

分享给朋友:

相关文章

腾讯文档回收站彻底删除文件真的找不回来了吗?

趁早打电话联系腾讯文档的人可能还有救,一般这种都是数据库里标记为删除,文件还没有实际删除,然后经过一段时间后程序统一进行真删除。这个“一段时间”可长可短,可能是一小时也可能是几天几个月甚至几年,要看腾讯服务器的程序是怎么写的。不过你联系腾讯...

到什么程度才叫精通 Linux?

我们医院有个大牛。有一次,我的Linux电脑下载了Microsoft office 365 不能运行。于是买了2.5升装康师傅冰红茶找到大牛,让他帮忙解决。大牛白了我一眼,让我把安装包发给他,只见他输入一个命令将安装包打开,整个屏幕都是数字...

如何进行 Elasticsearch 调优实践?

如何进行 Elasticsearch 调优实践?

面试官心理分析这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s ,坑爹了。第一次搜索的...

如何看待台积电,三星相继停供大陆7nm及更先进芯片?

在这个事出来之前,我就看到过一个说法,两家Foundry可以在中东建厂,让中东的Fab去干“脏活”。本质上是国内企业搞几个中东的代理人,装作是中东的初创Fabless企业去下单,人家Foundry大概率睁一只眼闭一只眼,只管数钱。然而,紧接...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

想学习Linux下的ELF文件有什么好书推荐吗?

想学习Linux下的ELF文件有什么好书推荐吗?

大家好,这里是物联网心球。 今天我们来聊聊ELF文件,了解一下Linux如何创建进程以及ELF文件如何转变成Linux进程?1.什么是ELF文件? ELF(Executable and Linkable Format)文...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。