本福德定律

本福德定律(由天文学家西蒙·纽康在1881首次提到)指出,如果我们随机从物理常数或统计数据表中选择一个数字,那么第一个数字将是“1”的概率大约为0.301,而不是如我们所预期的那样,如果所有数字都相等的话。一般说来,“定律”说第一个数字是“D”的概率是

这意味着一个物理常数表中的数字更可能以较小的数字开始,而不是更大的数字。这本书是由纽科姆在一篇题为《关于使用自然数的不同数字的频率的注释》中发表的,这篇论文发表在美国数学杂志(1881)4,39-40中。它在1938年被本福德重新发现,并出版了一篇名为《反常数定律》的文章。艾默尔。Phil。SoC 78,PP 51-72。

为了说明这个有趣的事实,试着列出ABRAMOWITZ表2.3中列出的物理常数的第一个数字和Stegun的《数学函数手册》。结果是下面的柱状图,它给出了表中44个常数的前导数字的分布,以及基于本福德的Law的理论预期分布:

除了明显不足的3,这是一个相当好的匹配,只有44个数据点。

尽管贝恩福德定律有许多冗长而博学的“解释”,但在我看来,它可以用一张图片来解释:

1 ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

显然,本福德定律的基本前提是,数量在基10和多个或任意任意单位中表示的数量的群体将在对数尺度上均匀地分布。这是由这些常数上的指数相当均匀地分布(至少超过几个数量级)所证实的。因此,数字“D”的概率明显地接近。

当然,我们能够为我们的物理常数选择了单位,使得前导数字都是9个(例如),但是显然我们有选择单元的自然倾向,这样我们的数字是按数量级均匀分布的,而不是绝对值。这可能与我们对听觉和视觉(以及地震)的基本印象有关,因为我们对响度和亮度的感觉印象是对数的。

当然,我们可以把BunFothe定律应用到任何基础上的数字,而不仅仅是基数10。一般来说,B基的数字D(在1到B-1的范围内)的概率是:

注意,对于二进制数,即在基2中表示的数字,前导数字为1的概率是1,因为它必须是,因为二进制数的前导非零位必然是1。下面示出从2到10的每个基B的数字1到B-1的概率分布。

我们还可以很容易地验证数字1到B-1的所有概率之和等于1,因为它必须是,因为前导数字必须是其中之一。这意味着

为了验证这一点,回忆对数的基本定律,Ln(ab)=Ln(a)+Ln(b)。这样,我们就可以把对数的和作为一个乘积的对数来重写:

证实了结果。

通过同样的分析,我们可以确定第二数字将具有一定的价值。只需要考虑一个数量级,因为模式在每个顺序上重复。例如,在基数10中,第二位数字为“3”的概率等于前两位数字的概率之和为“1.3”、“2.3”、“3.3”、…或“9.3”的数字在1到10的范围内。这是由阴影区域在下面所示的对数刻度中表示的。

这个区域的分数覆盖范围从1.3到1.4。

其他区域(如2.3到3.3等)覆盖的分数可以类似地找到,并且我们可以将它们相加以得到第一个数字的总概率。下列的第一个非零位将是3:

一般来说,在BASE-B数(从对数人口中获得)D的第二位数字的概率是

将这个分析扩展到第一个非零位之后的第n个数字的情况下,我们得到通式。

这适用于前导非零位的情况,理解为n=0,求和减少到仅单个项k=0。这个公式表明,当我们考虑不太重要的数字时,数字分布的不均匀性变小了。例如,我们有P{ 1 }=0.301019995…,p1个{ 1 }=0.113890103…p和p{ 1 }=0.101375977…因此,当我们前进到不太重要的数字时,“1”的概率很快接近1/10。

返回到MaTeScript主菜单