当前位置:首页 > 每日看点

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?

卡卷网1年前 (2025-03-24)每日看点249

楼上已有回答说了本福特定律,这里我来大概解释一下它的原理。

事实上,这个问题分为两部分:数学部分和非数学部分,数学部分又分为两部分:动力系统部分和统计学部分。

动力系统部分

数学上这是一个有关随机整数列首位分布的问题。在Stein的 Fourier Analysis 中有讲过Weyl等分布定理(Weyl's euqidistribution theorem)。在遍历论/动力系统中也有一个相关的定理,叫Birkhoff遍历定理(Birkhoff’s Ergodic Theorem)。下面我们来大概梳理一下它们之间的关系。

Weyl等分布定理

下面这位学长曾经写过详细的文章来介绍这件事情:

元亨利贞:{sin(n^p)}稠密性,Weyl准则,等分布序列Equidistributed Sequence

Birkhoff遍历定理

内容表述:对于保测动力系统 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 ,若系统是遍历的(即不存在非平凡的 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 -不变集),则对任意可积函数 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 ,时间平均几乎处处收敛于空间平均:

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

Ergodic theory - Wikipedia

这是Weyl等分布定理的推广。至于为什么是推广,如果有空了再写()

本福特定律

我们用一个例子来说明什么是本福特定律。

考察数列

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

记录它们的首位数字,直观上我们会觉得这是一个随机的排列,从而首位数字为 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

的概率都相等,即均为 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 然而事实并非如此。

事实上,映射

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

是遍历的(ergodic),即满足

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

这个网页中有所说明。

从而,Weyl等分布定理或者Birkhoff遍历定理告诉我们如下性质:

命题 . 在上述数列中,以 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 为首位数字的概率是

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第12张

感兴趣的小伙伴可以编程来验证

这直接地告诉我们:用等比数列生成的随机数并不是真随机数,而是一种伪随机数

我们着重考察具有这种性质的数据,引入如下定义:

定义 . 一组数据如果满足首位数字的概率

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

则称其满足本福特定律

注记 . 本福特定律事实上是一个定义而非定理!!!后面会再次重复。

注记 . 还可以对位数进行扩展,譬如 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 作为第 为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张 位数字的概率是

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第1张

数学部分就到此结束了。事实上数学也只能证明这么多。

统计学部分

本福特定律需要检验

那么(终于)问题来了,题主说的银行存款、河流长度为什么满足本福特定律呢?事实上,本福特定律是一个后验定义,即我们并不能知道哪些数据事实上满足本福特定律,当然,如果给定了数学表达式。我们可以推导,然而问题是现实生活中的数据往往没有准确的公式来表达。下面是两个例子:

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第17张

给npy阅读课小论文中用的例子

感谢评论区指正,注意上述数据来源于List of tallest buildings and structures - Wikipedia,这里的表格指的是按照不同材料/建筑方式建筑的最高高度!(更新于2025/3/17)

也并非所有的数列都满足本福特定律,例如:

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9?  第18张

给npy阅读课小论文中用的例子

那么最重要的问题就是:什么样的序列满足本福特定律?

因为本福特定律事实上是一个定义而非定理,我们可以考虑用特定的方式检验数据,从而判断其为真随机还是伪随机,如果是真随机,那么就不满足本福特定律,如果是伪随机,且满足本福特分布,才有的谈!

统计学中,常见的检验方式有二:Kolmogorov-Smirnov test 和 Kuiper's test,详见如下两个链接(均来自Wikipedia):

Kolmogorov–Smirnov test - WikipediaKuiper's test - Wikipedia

题主的问题

所以说,在给定一些银行存款,河流长度的数据后,可以使用特定方法检验它是否符合本福特定律的分布。

非数学部分

至于为什么那么多数据都满足本福特定律的分布,乃至于可以检验选举投票、税务、经济发展数据是否造假呢?(见Benford's Law | Brilliant Math & Science Wiki的最后一段)

——暂不清楚,这可能是个哲学问题吧

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/11996.html

分享给朋友:

相关文章

推荐几个问卷调查平台?

推荐几个问卷调查平台?

我给大家免费推荐一些市面上不多,且稳定的免费的问卷平台,这个在网上都是能够搜索到的,有的还是世界500钱企业,这里推荐的基本上都是上市的问卷公司了。上面都是可以免费去注册的,对外公开开放的,做完了直接奖励美刀的,不需要兑换卡什么的。 C…

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯神贴合集完整版,给大家整理好了! 那年大学,打开天涯,感觉打开了一片新天地,里面什么样的人都有,有大神也有蛇神,比某乎好太多了,可惜后面关了很多年前,天涯社区曾出现了不少深受欢迎的帖子,成功地预言了许多形势和事件。这些帖子因此被冠以“天…

我爸讽刺我,写个破代码一年才十几万,他在工地带50个人,让我回去跟他干,写代码没出路,我该怎么选择?

我跟你一样的情况,本人现身说法,千万不要跟你爸干,我就是反面教材,现在想回去都回不去了,快十年没写代码了,再就是岁数大了,38岁了,35岁以上的码农根本就没公司愿意要,而且会受歧视。 工程不好干,首先就是不合法,在法律层面,根本就没有包工头…

自媒体如何快速起步?

自媒体如何快速起步?

有两种经验,可供参考。 第一种是:现象级的爆火、爆款,这种情况捞到钱,实现财务自由的人并不多,但确实存在。只不过非要说清楚为什么这个账号可以火、可以短时间内赚到普通人一辈子赚不到的钱,他们自己也不一定能说清楚,因为赶上了风口(内外部情况)。…

为什么扫码支付在中国流行,在发达国家被排斥?

因为这是一种落后的技术。 卖菜的大爷花5毛钱就可以打印出一张二维码来接受付款。 你觉着这种先进么?跟先进完全不沾边的。正是因为不先进,所以才能流行。 卖菜大爷用不起一台先进的、具有NFC感应功能的、还能刷各种银行卡的收款机。 这就是现实。…

下一个风口最可能是什么?

下一个风口最可能是什么?

肯定是一带一路了,国内没什么卷的空间了,现在国家正在给一带一路的第三世界国家建设基础设施,等交通打通之后,就是通信打通,通信打通就是贸易打通,未来我建议大家重仓小语种,阿拉伯语最值得学(也有其他小语种自己去查一带一路国家),将来去其他国家随…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。