×

信任统计显著性:将(p)值转换为保守的后验概率和贝叶斯因子。 (英语) Zbl 07729081号

小结:一种对滥用(p\)值的补救方法将其转换为贝叶斯因子的边界。对于零假设的先验概率,这样的界给出了后验概率的下限。不幸的是,知道后验概率高于某个数字并不能确保零假设不太可能被拒绝。例如,如果下限是0.0001,则表示后验概率至少为0.0001,但并不表示它低于0.05甚至0.9。一个基准论点建议对空假设成立的后验概率进行另一种估计。在原假设的先验概率为50%的情况下,对于低(p),估计的后验概率约为(p(ln p)^2。在其他情况下,公式中每出现一次“(p)”都是通过将其乘以原假设的先验概率来校准的“(p”值。在没有先验的情况下,(p(ln p)^2)也可以作为渐近贝叶斯因子。由于后验概率的基准估计值大于下限,因此用它来代替下限会导致更严格的假设检验。在0.005的基础上进行替换,因为显著性水平降低到0.001。

MSC公司:

62A01型 统计学基础和哲学主题
62第25页 统计学在社会科学中的应用
第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Seibold,H。;查尔顿,A。;Boulesteix,AL,统计学家,卷起袖子!有一场危机需要解决,意义,1842-44(2021)·数字对象标识代码:10.1111/1740-9713.01554
[2] Ioannidis,JP.,《为什么大多数公布的研究结果都是虚假的》,《公共科学图书馆·医学》,第2期,e124(2005)·doi:10.1371/journal.pmed.0020124
[3] 按钮,KS;约阿尼迪斯,JP;Mokrysz,C.,《停电:为什么小样本会破坏神经科学的可靠性》,《国家神经科学评论》,第14365页(2013年)·doi:10.1038/nrn3475
[4] Nieuwenhuis,S。;佛罗里达州福斯特曼;华盛顿州Wagenmakers。,《神经科学中交互作用的错误分析:意义问题》,《国家神经科学》,第141105页(2011年)·doi:10.1038/nn.2886
[5] LG.哈尔西。,p值的统治已经结束:我们可以采用什么替代分析来填补权力真空?,生物快报,15(2019)·doi:10.1098/rsbl.2019.0174
[6] Hughes,B.,《危机中的心理学》(2018),伦敦:帕尔格雷夫,伦敦
[7] 苏格兰皇家银行Bausell。,《科学问题:再现性危机及其应对措施》(2021年),牛津:牛津大学出版社,牛津
[8] 开放科学合作,评估心理科学的再现性,《科学》,349,aac4716(2015)·doi:10.1126/science.aac4716
[9] Trafimow,D。;Marks,M.,《基础应用社会心理学》编辑,37,1-2(2015)·doi:10.1080/01973533.2015.1012991
[10] Lash,TL.,《零假设显著性检验文化对再现性的危害》,《美国流行病学杂志》,186627-635(2017)·doi:10.1093/aje/kwx261
[11] 弗里德曼,LP;Cockburn,IM;Simcoe,TS.,《临床前研究中再现性的经济学》,《公共科学图书馆·生物》,13,e1002165(2015)·doi:10.1371/journal.pbio.1002165
[12] Wasserstein,RL;美国国家统计局Lazar,NA,《美国统计局关于p-values:背景、过程和目的的声明》,70,129-133(2016)·兹伯利07665862 ·doi:10.1080/00031305.2016.1154108
[13] DJ本杰明;JO伯杰;Johannesson,M.,Redefine统计显著性,Nat Hum Behav,2,6-10(2018)·doi:10.1038/s41562-017-0189-z
[14] Matthews,R.,《五年后的p值声明》,《重要性》,第18期,第16-19页(2021年)·数字对象标识代码:10.1111/1740-9713.01505
[15] DJ本杰明;JO Berger,《改善p值使用的三项建议》,《美国统计》,第73期,第186-191页(2019年)·兹伯利07588201 ·doi:10.1080/00031305.2018.1543135
[16] Habiger,J。;Liang,Y.,《可复制研究的出版政策和社区范围内的错误发现率》,美国统计局(2022年)·Zbl 07619671号 ·doi:10.1080/0031305.2021.1999857
[17] 持有,L。;Ott,M.(2018)·doi:10.1146/statistics.2018.5第1期
[18] 夸托,P。;Ripamonti,E。;Marasini,D.,超越p。05:评估p值的新贝叶斯建议的批判性回顾,《生物危害统计杂志》,32,308-329(2022)·doi:10.1080/10543406.2021.2009497
[19] Ruberg,SJ.,Détente:对p值和贝叶斯后验概率的实际理解,《临床药理学与治疗》,1091489-1498(2021)·doi:10.1002/cpt.v109.6
[20] Bickel,DR.,Sharpen统计显著性:证据阈值和贝叶斯因子锐化为Occam剃刀,Stat,8,e215(2019)·doi:10.1002/sta4.v8.1
[21] 陈,F。;Ye,K。;Wang,M.,相关性和偏相关性的最小贝叶斯因子假设检验,公共统计理论方法,502467-2480(2021)·Zbl 07533678号 ·doi:10.1080/03610926.2019.1667397
[22] Son.Goodman,《走向循证医学统计》。2:贝叶斯因子,《国际医学年鉴》,130,1005-1013(1999)·doi:10.7326/0003-4819-130-12-199906150-00019
[23] 塞尔克,T。;巴亚里,MJ;JO Berger,《检验精确零假设的p值校准》,《美国统计》,55,62-71(2001)·Zbl 1182.62053号 ·doi:10.1198/000313001300339950
[24] Kline,B.,基于p值和强度受限的先验集的贝叶斯因子,美国统计局(2021年)·Zbl 07619682号 ·doi:10.1080/00031305.2021.1877815
[25] Bickel,DR.,《零假设显著性检验通过贝叶斯模型检验进行辩护和校准》,《美国统计》,75,249-255(2021)·Zbl 07632862号 ·doi:10.1080/00031305.2019.1699443
[26] 贝叶斯频率统计导论:走出复制危机。即将到来。2023https://davidbickel.com/crisis/。
[27] Bickel,DR.,关于基准模型平均作为检查贝叶斯模型和频率模型的替代方法的注释,《公共统计理论方法》,47,3125-3137(2018)·Zbl 1508.62004号 ·doi:10.1080/03610926.2017.1348522
[28] Efron,B.,《大尺度推断:估计、测试和预测的经验贝叶斯方法》(2010),剑桥:剑桥大学出版社,剑桥·Zbl 1277.62016年
[29] Bickel,DR.,《通过估计符号错误概率解释和校准的零假设显著性检验:贝叶斯频率连续统》,《美国统计》,75,104-112(2021)·Zbl 07632826号 ·doi:10.1080/0031305.2020.1816214
[30] Bickel,DR.,《区间估计、点估计和零假设显著性检验》,由零假设的估计后验概率校准,《公共统计理论方法》,52,763-787(2023)·Zbl 07649640号 ·doi:10.1080/03610926.2021.1921805
[31] Box,G.,科学建模和稳健性中的抽样和贝叶斯推断,J R Stat Soc A,143,383-430(1980)·兹比尔0471.62036 ·doi:10.2307/2982063
[32] 巴博萨·卡布拉尔,CR;德索萨,荷兰;Leáo,J.,使用偏态正态分布比例混合有限混合的贝叶斯测量误差模型,J Stat Comput Simul,92,623-644(2022)·Zbl 07497837号 ·网址:10.1080/00949655.2021.1969397
[33] Gelman,A。;CR.沙利兹,《贝叶斯统计的哲学和实践》,英国数学统计心理学杂志,66,8-38(2013)·Zbl 1410.62009年 ·doi:10.1111/j.2044-8317.2011.02037.x
[34] Hjort,N。;Dahl,F。;Steinback,G.,处理后的后验预测p值,美国统计学会杂志,1011157-1174(2006)·Zbl 1120.62307号 ·doi:10.1198/016214500500001393
[35] 斯坦巴克,GH;佐治亚州斯托维克。,贝叶斯层次模型中的后验预测p值,《斯堪的纳维亚统计杂志》,36,320-336(2009)·Zbl 1190.62061号 ·doi:10.1111/j.1467-9469.2008.00630.x
[36] 赵,G。;Xu,X.,Fieller问题的单侧后验预测p值,Stat Probab Lett,95,57-62(2014)·Zbl 1307.62076号 ·doi:10.1016/j.spl.2014.07.033
[37] Bickel,DR.,《基因组学数据分析:错误发现率和经验贝叶斯方法》(2019),纽约:查普曼和霍尔/CRC,纽约
[38] 比克尔博士;Rahal,A.,《纠正错误发现率对假阳性的偏见》,《通信统计模拟计算》,503699-3713(2021)·Zbl 1497.62203号 ·doi:10.1080/036109182019.1630432
[39] WJ Hong;Tibshirani,R。;Chu,G.,“局部错误发现率促进了不同微阵列实验的比较”,《核酸研究》,37,7483-7497(2009)·doi:10.1093/nar/gkp813
[40] Colquhoun,D.,研究的再现性和p值的误解,R Soc Open Sci,4(2017)·doi:10.1098/rsos.111085
[41] Colquhoun,D.,《假阳性风险:关于如何处理p值的建议》,《美国统计》,第73期,192-201年(2019年)·Zbl 07588202号 ·doi:10.1080/00031305.2018.1529622
[42] 埃夫隆,B。;蒂布希拉尼,R。;Storey,JD,微阵列实验的经验贝叶斯分析,J Am Stat Assoc,96,1151-1160(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[43] Bickel,DR.,置信分布和经验Bayes后验分布统一为证据支持的分布,Commun Stat Theory Methods,51,3142-3163(2022)·Zbl 07535583号 ·doi:10.1080/03610926.2020.1790004
[44] Bickel,DR.,《系统发生树和分子进化:修正不确定性量化的实践介绍》(2022年),纽约:Springer,New York
[45] 李,M。;Vitányi,P.,kolmogorov复杂性及其应用简介(2019年),纽约:Springer,纽约·Zbl 1423.68005号
[46] Wasserstein,RL;斯基姆,AL;《走向超越“p<0.05”的世界》,美国统计局,第73期,第1-19页(2019年)·Zbl 07588180号 ·doi:10.1080/00031305.2019.1583913
[47] Wellek,S.,《当前“p值争议”的批判性评估》,《生物杂志》,59,854-872(2017)·Zbl 1391.62254号 ·doi:10.1002/bimj.201700001
[48] Y.本杰米尼。;Veaux,RDD;Efron,B.,《ASA主席关于统计重要性和可复制性的特别工作组声明》,《Ann Appl Stat》,第15期,第1084-1085页(2021年)·Zbl 1478.62008号 ·doi:10.1214/21-AOAS1501
[49] Mayo,DG;Hand,D.,《统计意义及其批评者:实践破坏性科学,还是破坏性科学实践?》?,合成,200220(2022)·doi:10.1007/s11229-022-03692-0
[50] Lindsey,J.,参数统计推断(1996),牛津:牛津科学出版物,克拉伦登出版社,牛津·兹比尔0855.62002
[51] RJ.Allen,《举证责任》,《法律问题风险》,第13期,195-219页(2014年)·doi:10.1093/lpr/mgu005
[52] 持有,L。;波韦,DS;Gravestock,I.,《带偏差统计的近似贝叶斯模型选择》,《统计科学》,30,242-257(2015)·兹比尔1332.62094 ·doi:10.1214/14-STS510
[53] 埃夫隆,B。;Tibshirani,R.,微阵列的经验贝叶斯方法和错误发现率,《基因流行病学》,23,70-86(2002)·doi:10.1002/(ISSN)1098-2272
[54] Y.本杰米尼。;Hochberg,Y.,控制错误发现率:一种实用而强大的多重测试方法,J R Stat Soc B,57289-300(1995)·Zbl 0809.62014号
[55] Whittemore,AS,《多重测试的贝叶斯错误发现率》,《应用统计杂志》,34,1-9(2007)·Zbl 1119.62379号 ·doi:10.1080/02664760600994745
[56] Wacholder,S。;Chanock,S。;Garcia-Closas,M.,《评估阳性报告为假的概率:分子流行病学研究方法》,美国国家癌症研究所杂志,96,434-442(2004)·doi:10.1093/jnci/djh075
[57] Bickel,DR.,在没有强参数假设的情况下,仅给出一个或两个p值的错误发现率的简单估计,Stat Appl Genet Mol Biol,12529-543(2013)·Zbl 1311.62109号 ·doi:10.1515/sagmb-2013-003
[58] Hannig,J。;Iyer,H。;Lai,RC,《广义基准推断:综述与新结果》,美国统计学会期刊,1111346-1361(2016)·doi:10.1080/01621459.2016.1165102
[59] 罗杰·鲍沃特(Bowater,RJ.),《主观基准推断的辩护》,AStA Adv Stat Ana,101,177-197(2017)·Zbl 1443.62013年 ·doi:10.1007/s10182-016-0285-9
[60] Shi,H。;Yin,G.,单侧和双侧检验下的重新连接p值和后验概率,美国统计,75,265-275(2021)·Zbl 07632864号 ·doi:10.1080/00031305.2020.1717621
[61] Johnstone,DJ。,《理论和实践意义的检验》(含讨论),统计学家,35491-504(1986)·doi:10.2307/2987965
[62] Bickel,DR.贝叶斯和频率学家的推断源自证据第一原则,应用于传播统计方法的不确定性。工作文件。2022.doi:空
[63] 费希尔,RA。,随机变量概念的逻辑倒置,Sankhya Indian J Stat(1933-1960),7129-132(1945)·Zbl 0060.30110号
[64] 费希尔,RA。,《统计方法和科学推断》(1973),纽约:哈夫纳出版社,纽约·Zbl 0281.6202号
[65] 斯普洛特,DA,《科学中的统计推断》(2000年),纽约:施普林格,纽约·Zbl 0955.62006号
[66] 罗宾逊,GK。,统计程序的条件属性,Ann Stat,7742-755(1979)·Zbl 0423.62005号 ·doi:10.1214操作系统/1176344725
[67] DAS弗雷泽。,辅助和条件推理,《统计科学》,19,333-351(2004)·Zbl 1100.62534号 ·doi:10.1214/08834230400000323
[68] Hannig,J.,《关于广义基准推断》,Stat Sin,第19期,第491-544页(2009年)·Zbl 1168.62004号
[69] Hannig,J。;Iyer,H。;Patterson,P.,《信度广义置信区间》,美国统计协会期刊,101,254-269(2006)·Zbl 1118.62316号 ·doi:10.1198/01621450000000736
[70] 王,C。;Hannig,J。;香港Iyer,《基准预测区间》,J Stat Plan Inference,1421980-1990(2012)·Zbl 1237.62038号 ·doi:10.1016/j.jspi.2012.02.021
[71] 阿联酋登普斯特。,《面向统计学家的Dempster-Shafer演算》,《国际J近似推理》,48,365-377(2008)·Zbl 1274.62053号 ·doi:10.1016/j.ijar.2007.03.004
[72] 马丁·R。;Liu,C.,《推断模型:无先验-后验概率推断的框架》,美国统计协会,108,301-313(2013)·Zbl 06158344号 ·doi:10.1080/01621459.2012.747960
[73] Plante,A.,使用不当置信区间的高斯替代方法,加拿大统计局,48,773-801(2020)·Zbl 1492.62033号 ·doi:10.1002/cjs.v48.4
[74] Wilkinson,GN.,《关于解决统计推断中的争议》,JRSS B,39,119-144(1977)·兹伯利0373.62002 ·doi:10.1111/j.2517-6161.1977.tb01613.x
[75] 比克尔博士;Padilla,M.,相干推断的无先验框架及其简单收缩估计的推导,J Stat Plan inference,145,204-221(2014)·Zbl 1279.62068号 ·doi:10.1016/j.jspi.2013.08.011
[76] 比特尤科夫,S。;Krasnikov,N。;Nadarajah,S.,统计推断中的置信分布,AIP Conf Proc,1305,346-353(2011)·数字对象标识代码:10.1063/1.3573637
[77] Kim,D。;Lindsay,BG,《使用置信度分布抽样来可视化置信度集》,Stat Sin,21923-948(2011)·Zbl 1213.62052号 ·doi:10.5705/ss.2011.v21n2a
[78] Nadarajah,S。;比特尤科夫,S。;Krasnikov,N.,《置信分布:综述》,《Stat Methodol》,第22期,第23-46页(2015年)·Zbl 1486.62071号 ·doi:10.1016/j.stamet.2014.07.002
[79] 波兰斯基,AM。,《观察到的置信水平:理论和应用》(2007),纽约:查普曼和霍尔出版社,纽约
[80] 施维德,T。;荷兰Hjort,《置信度和可能性》,《Scand J Stat》,29,309-332(2002)·Zbl 1017.62026号 ·doi:10.1111/sjos.2002.29.29第2期
[81] 辛格,K。;谢,M。;威斯康星州斯特劳德曼。,通过置信度分布组合独立来源的信息,《Ann Stat》,33,159-183(2005)·Zbl 1064.62003年 ·doi:10.1214/009053604000001084
[82] 辛格,K。;谢,M。;威斯康星州斯特劳德曼。,置信分布(CD)-参数的分布估计,IMS Lect Notes Monogr Ser 2007,54,132-150(2007)
[83] 塔拉尔德森,G。;Lindqvist,BH.,条件基准模型,J Stat Plan Inference,195,141-152(2018)·Zbl 1383.62066号 ·doi:10.1016/j.jspi.2017.09.007
[84] 田,L。;王,R。;Cai,T.,最高置信密度区域及其在约束参数联合推断中的应用,《生物统计学》,67,604-10(2011)·Zbl 1217.62038号 ·文件编号:10.1111/j.1541-0420.2010.01486.x
[85] Bickel,DR.,置信区间、显著性值、最大似然估计等被锐化为Occam剃刀,《公共统计理论方法》,49,2703-2712(2020)·Zbl 1511.62007年 ·doi:10.1080/03610926.2019.1580739
[86] 卡塞拉,G。;Berger,RL.,《单边测试问题中贝叶斯和频率学家证据的调和》,美国统计协会杂志,82,106-111(1987)·Zbl 0612.62021号 ·doi:10.1080/01621459.1987.10478396
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。