本福德定律

本福德定律(1881年由天文学家西蒙·纽科姆首次提及)指出,如果我们从物理常数表或统计数据中随机选择一个数字,那么第一个数字成为“1”的概率约为0.301,而不是我们预期的0.1,如果所有数字的可能性都相同的话。一般来说,“定律”说第一个数字是“d”的概率是

这意味着物理常数表中的数字更可能以较小的数字开头,而不是以较大的数字开头。它是由Newcomb在一篇题为“关于自然数中不同数字的使用频率的说明”的论文中发表的,该论文发表在美国数学杂志(1881)4,39-40上。1938年Benford重新发现了它,并在Proc上发表了一篇名为“反常数定律”的文章。阿默尔。菲尔。Soc 78,第551-72页。

为了说明这个有趣的事实,试着将Abramowitz和Stegun的“数学函数手册”表2.3中列出的物理常数的前几位数字制成表格。结果如下所示,条形图给出了表中44个常数的前导数字的分布,以及基于本福德定律的理论预期分布:

除了明显的3的不足之外,这是一个相当好的匹配只有44个数据点。

虽然对本福德定律有许多冗长而博学的“解释”,但在我看来,它可以用一张图片来解释:

———————————————————————————————————————————————————————————————————————————

显然,本福德定律的基本前提是,以10为基数或更多或更少的任意单位表示的量的主体总体将在对数尺度上相当均匀地分布。这些常数上的指数分布相当均匀(至少在几个数量级上)这一事实证实了这一点。因此,前导数字被“d”的概率明显接近

当然,我们能够我们已经为物理常数选择了单位,这样前导数字都是9(例如),但显然我们有一种自然倾向,就是选择单位,以便我们的数字按数量级均匀分布,而不是绝对值。这可能与我们对听觉和视觉(以及地震)的基本印象有关,因为我们对响度和亮度的感觉是对数的。

当然,我们可以将本福德定律应用于以任何基数表示的数字,而不仅仅是以10为基数。一般来说,基数B的前导数字d(在1到B-1的范围内)的概率是

注意,对于二进制数,即以2为基数表示的数字,前导数字是1的概率是1.000,这是必然的,因为二进制数的前导非零数字必然是1。数字1到B-1的概率分布对于每个基数B从2到10如下所示。

我们还可以很容易地验证数字1到b-1的所有概率之和等于1.0000,因为前导数字必须是其中之一。这意味着

为了验证这一点,回想一下对数的基本定律,ln(ab)=ln(a)+ln(b)。这样,我们可以将对数之和改写为乘积的对数:

这证实了结果。

通过同样的分析,我们可以确定第二数字将具有一定的值。只需要考虑一个数量级,因为模式在每个阶上都是重复的。例如,在基数10中,第二位数为“3”的概率等于前两位数为“1.3”、“2.3”、“3.3”。。。或“9.3”表示1到10之间的数字。这由下面显示的对数刻度的阴影区域表示。

在1.3到1.4范围内,该区域的分数为

其他区域(如2.3到3.3,等等)覆盖的分数也可以类似地找到,我们可以将它们相加,得出第一位数的总概率下列的第一个非零位数字为3:

一般来说,以B为基数的数(取自对数总体)中d的第二位数的概率为

将此分析推广到第n位数字跟在第一个非零位数字之后的情况,我们得到了一般公式

对于非零的情况,k=0的求和适用于这个理解。这个公式表明,当我们考虑低有效位数时,位数分布的不均匀性变得更小。例如,我们有P0{1} =0.301019995…,页1{1} =0.113890103…和P2{1} =0.101375977。。。因此,“1”的概率很快接近1/10,因为我们继续进行低有效数字。

返回MathPages主菜单