×

对本福德定律的严峻考验。 (英语) Zbl 1520.62006年

概述:Benford定律通常用于支持与数据质量、数据操作甚至大数据集中欺诈的存在相关的关键决策。然而,许多作者认为,如果在此类应用中应用于典型尺寸的样本,即使存在微小且实际上不重要的偏离本福德定律的情况,传统统计检验也会拒绝“本福德度”数据的无效性。因此,他们建议使用缺乏坚实统计基础的替代标准。本文在Benford定律测试的背景下,对“大功率”(或“过剩功率”)问题进行了讨论。这一问题与良好性测试的严重性测试的概念有关,特别侧重于符合本福德定律的测试。为此,我们还导出了平均绝对偏差的渐近分布(摩洛哥迪拉姆)统计量以及渐近标准正态检验。最后,将严重性测试原则应用于六个有争议的大数据集,以评估其“Benford-ness”。

理学硕士:

62E20型 统计学中的渐近分布理论
62F03型 参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴尼,BJ;KS Schulzke,《在Benford的法律研究和实践中用过度MAD缓和“哭狼”事件》,《法医账户研究杂志》,1,1,A66-A90(2016)·doi:10.2308/jfar-51622
[2] Benford,F.,《反常数定律》,Proc Am Philos Soc,78,4,551-572(1938)
[3] Berkson,J.,《应用齐方检验时遇到的一些解释困难》,美国统计协会杂志,33,203,526-536(1938)·Zbl 0019.17701号 ·doi:10.1080/01621459.1938.10502329
[4] 闭塞,HW;Savits,TH,Benford数据的一般示例,美国统计局,64,4,335-339(2010)·Zbl 1217.62218号 ·doi:10.1198/tast.2010.09169
[5] Cerqueti,R。;Lupi,C.,《符合本福德定律的一些新测试》,Stats,4,3,745-761(2021)·doi:10.3390/stats4030044
[6] Cho,WKT;Gaines,BJ,《打破(本福德)法:竞选资金中的统计欺诈检测》,美国国家统计局,61,32218-223(2007)·doi:10.1198/000313007x223496
[7] Cohen,J.,《地球是圆的》(p<0.05),《美国心理学》,49,12,997-1003(1994)·doi:10.1037/0003-066x.49.12.997
[8] 德雷克,PD;Nigrini,MJ,使用Benford定律的计算机辅助分析程序,《会计教育杂志》,18,2,127-146(2000)·doi:10.1016/s0748-5751(00)00008-7
[9] 德鲁伊·E。;Oancea,B。;Válsan,C.,Benford定律和数字分析的极限,《国际J账户信息系统》,31,75-82(2018)·doi:10.1016/j.accinf.2018.09.004
[10] Fewster,RM,Benford定律的简单解释,美国国家统计局,63,1,26-32(2009)·doi:10.1198/tast.2009.0005
[11] Granger,CW,从巨型面板和高频数据中提取信息,Stat Neerl,52,3,258-272(1998)·Zbl 0924.62122号 ·数字对象标识代码:10.1111/1467-9574.00084
[12] Hill TP(1995a)《基础方差》暗示了本福德定律。《美国数学学报》123(3):887-895。doi:10.1090/s0002-9939-1995-1233974-8·Zbl 0813.60002号
[13] Hill TP(1995年b)有效数字定律的统计推导。统计科学10(4):354-363。doi:10.1214/ss/1177009869·Zbl 0955.60509号
[14] Kaiser,M.,Benford定律作为调查可靠性的指标——我们能相信我们的数据吗?,《经济研究杂志》,第33、5、1602-1618页(2019年)·doi:10.1111/joes.12338
[15] 科斯索夫斯基(Kossovsky),AE,《关于Benford定律中对齐方检验的错误使用》,Stats,4,2,419-453(2021)·doi:10.3390/stats402027
[16] 莱曼,EL;Romano,JP,《检验统计假设》(2005),纽约:Springer,纽约·2018年6月17日
[17] 李,F。;韩,S。;Zhang,H.,Benford定律在数据分析中的应用,J Phys Conf Ser,1168,3,032133(2019)·doi:10.1088/1742-6596/1168/3/032133
[18] 林德利,DV,《统计悖论》,《生物统计学》,44,1-2,187-192(1957)·Zbl 0080.12801号 ·doi:10.2307/2333251
[19] Mayo,DG,《作为严峻考验的统计推断:如何超越统计战争》(2018),剑桥:剑桥大学出版社,剑桥·Zbl 1400.62002号 ·doi:10.1017/9781107286184
[20] Mayo,DG;Spanos,A.,《严格测试作为内曼·皮尔逊归纳哲学中的一个基本概念》,Br J Philos Sci,57,2,323-357(2006)·Zbl 1098.03030号 ·doi:10.1093/bjps/axl003
[21] Mayo DG,Spanos A(2010)错误统计哲学。收录:Mayo DG,Spanos A(eds)Error and inference——关于实验推理、可靠性以及科学的客观性和合理性的最新交流。剑桥大学出版社,剑桥,第2章,第15-27页·邮编:1257.00006
[22] Mayo DG,Spanos A(2011)错误统计。收录于:Bandyopadhyay PS,Forster MR(eds)科学哲学手册,第7卷。统计原理。Elsevier,第153-198页。doi:10.1016/b978-0-444-51862-0.50005-8·Zbl 1230.62002号
[23] 纽科姆,S.,关于自然数中不同数字使用频率的注释,《美国数学杂志》,4,1,39-40(1881)·doi:10.2307/2369148
[24] Nigrini,MJ,Benford’s law:法务会计、审计和欺诈检测应用(2012),霍博肯:约翰·威利父子公司,霍博克·doi:10.1002/9781119203094
[25] R开发核心团队(2021)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。http://R-project.org
[26] 雷米,RA,《第一个数字问题》,《美国数学杂志》,83,7,521-538(1976)·Zbl 0349.60014号 ·doi:10.2307/2319349
[27] Rodriguez,RJ,均匀分布混合物中的第一个有效数字模式,《美国统计》,58,1,64-71(2004)·Zbl 1182.62224号 ·doi:10.1198/0003130042782
[28] Ross,KA,Benford定律,增长产业,《Am Math Mon》,118,7,571-583(2011)·Zbl 1225.00007号 ·doi:10.4169/amer.math.monthly.118.07.571
[29] 斯蒂格勒,SM,斯蒂格勒的同名律,Trans N Y Acad Sci,39,1,147-157(1980)·doi:10.1111/j.2164-0947.1980.tb02775.x
[30] Tsagbey,S。;德卡瓦略,M。;Page,GL,所有数据都是错误的,但有些数据有用吗?倡导数据审计的必要性,美国国家统计局,71,3231-235(2017)·Zbl 07687905号 ·doi:10.1080/00031305.2017.1311282
[31] Whyman,G。;舒尔辛格,E。;Bormashenko,E.,《阐明本福德定律起源和适用性的直觉考虑》,《物理结果》,6,3-6(2016)·doi:10.1016/j.rinp.2015.11.010
[32] Wickham H(2016)ggplot2:数据分析的优雅图形。使用R!,纽约州施普林格。网址:https://ggplot2.tidyverse.org ·兹比尔1397.62006
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。