本网站由捐赠支持OEIS基金会.

本福德定律

来自OeisWiki
跳转到:航行,搜索


这篇文章的页面是一个存根,请通过展开它来提供帮助。



这篇文章正在建设中。            

请不要依赖其中包含的任何信息。            


给定一组有限的数字数据,预计数字1到9将以大致相等的概率作为第一个数字出现。然而,在许多情况下,数字1最常出现在第一位,概率约为30%,而其他数字出现的频率则逐渐降低。

这叫做本福德定律Frank Benford注意到对数桌子。Benford还注意到,在许多不同的数据集中,包括原子量、棒球统计数据和街道地址,存在着这种意想不到的差异。

底特律布鲁克斯木材公司的房屋数字精选。请注意1s、2s和7s的新包装。

即使在不一定反映数字的第一个数字和其他数字之间用法差异的情况下,也可以观察到本福德定律的影响。据推测,建筑承包商了解本福德法律,并知道该法律是否适用于他们正在建造的房产的地址。另一方面,硬件商店可能不知道要购买什么地址的替代房屋数字,给定的数字可以很容易地用于房屋地址的最后一位,也可以用于第一位。然而,与其他数字相比,库存更多的1和2仍然是一个好主意。

素数与Benford定律

注:素数不满足本福德定律(Daniel I.A.Cohen和Talbot M.Katz,“素数和第一位数现象”,《数论杂志》18(1984),261-268;A.Berger和T.P.Hill,《本福德定律是什么?》?,通知,Amer。数学。Soc.,64:2(2017),132-134.)

街道地址不同于质数在这种情况下,即使我们包括了世界上所有的地址,我们仍然在处理一个有限集,而素数是无穷多的。[1]因此,为了简化我们自己的事情,在本文中,我们将只考虑达到某个阈值的素数。为了使数字2到9有一个合理的抖动,我们将阈值设置为10.

我们看到,第一个数字只有10,1开始就很糟糕,因为我们不再考虑1素数(原因超出了本文的范围)。人们可能会出于残疾的原因暂时将1视为最佳,但只要达到100就表明这是不必要的。

1 2 4 5 6 7 8 9
最多10个 0 1 1 0 1 0 1 0 0
最多100 4 2 4 2 1
高达1000 25 19 19 20 17 18 18 17 15
高达10000 160 146 139 139 131 135 125 127 127
最多10个5 1193 1129 1097 1069 1055 1013 1027 1003 1006
最多10个6 9585 9142 8960 8747 8615 8458 8435 8326 8230
最多10个7 80020 77025 75290 74114 72951 72257 71564 71038 70320
最多10个8 686048 664277 651085 641594 633932 628206 622882 618610 614821
最多10个9 6003530 5837665 5735086 5661135 5602768 5556434 5516130 5481646 5453140
囊性纤维变性。: A073517号 A073516号 A073515号 A073514号 A073513号 A073512号 A073511号 A073510号 A073509号

然而,随着我们进一步提高,1作为第一位数字的优势逐渐削弱。

另一种方法是查看以给定数字开头的第50个质数是什么现在,50有点武断:这个选择是通过粗略估计得出的术语可见性用于相关OEIS序列条目。

第五十
1 1171 A045707号
2 2243 A045708号
3259 A045709号
4 4231 A045710型
5 5297 A045711号
6 6269 A045712号
7 7309 A045713号
8 8291 A045714号
9 9311 A045715号

如果对这50个素数我们去掉前导数字,我们会发现9的结果比1的结果要高得多。

但对素数定理这表明,当我们看到10的越来越高的幂时,第一个数字的分布将变得或多或少均匀,从而得出本福德定律实际上并不适用于素数的结论。

工具书类

  • Daniel I.A.Cohen和Talbot M.Katz,“素数和第一位数现象”J.数论 18(1984), 261-268.