×

拒绝率和拒绝率:检验假设的统计实践建议。 (英语) Zbl 1357.62018年

数学杂志。精神病。 72,90-103(2016); 更正同上,89,98(2019)。
概要:大部分科学(正确或错误)都是由假设检验驱动的。即使在假设检验范式正确的情况下,仅仅基于(p)值进行推断的常见做法也受到了50多年的强烈批评。作为一种替代方案,我们建议使用正确拒绝零假设的几率来代替错误拒绝。实验前版本(包括功率和I型错误)和实验后版本(取决于实际数据)都被考虑在内。提供的实现范围从仅依赖于“p”值到考虑完整的贝叶斯分析。令人惊讶的是,所有实现——甚至是完整的贝叶斯分析——都有完整的频率分析证明。我们的提案版本可以实现,只需要对现有实践进行少量修改,但也可以克服一些最严重的缺点。

MSC公司:

62A01型 统计学基础和哲学主题
62F03型 参数假设检验
2015年1月62日 贝叶斯推断
62升10 顺序统计分析
第62页第15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anscombe,F.J.,《连续观察的固定样本大小分析》,生物计量学,10,1,89-100(1954)·Zbl 0058.12902号
[2] Bem,D.J.,《感受未来:认知和情感反常追溯影响的实验证据》,《人格与社会心理学杂志》,100,3,407-425(2011)
[3] 本杰明·D·J。;Choi,J.J。;斯特里克兰,A.J.,《社会身份和偏好》,《美国经济评论》,1001913-1928(2010)·Zbl 1215.65184号
[4] Berger,J.,《统计决策理论和贝叶斯分析》(1985),Springer-Verlag:Springer-Verlag纽约·Zbl 0572.62008号
[5] J.Berger,Fisher、Jeffreys和Neyman是否同意测试(讨论)?,统计科学,18,1-32(2003)·Zbl 1048.62006号
[6] J.伯杰。;Berry,D.,《停止规则在统计推断中的相关性(讨论)》,(统计决策理论和相关主题IV(1988),Springer-Verlag:Springer-Verlag纽约)
[7] J.伯杰。;Boukai,B。;Wang,Y.,精确假设的统一频率学家和贝叶斯检验(讨论),统计科学,12,3,133-160(1997)·Zbl 0955.62527号
[8] J.伯杰。;布朗,L。;Wolpert,R.,固定和序贯假设检验的统一条件频率学家和贝叶斯检验,《统计年鉴》,221787-1807(1994)·兹伯利0824.62002
[9] J.伯杰。;Mortera,J.,非嵌套假设检验的默认贝叶斯因子,美国统计协会杂志,94542-554(1999)·Zbl 0996.62018号
[10] Berger,K。;Pericchi,L.,《模型选择的客观贝叶斯方法:介绍和比较(讨论)》,(Lahiri,P.,In model selection.In model selection,Institute of Mathematical Statistics课堂讲稿-专著系列,第38卷(2001),Beachwood Ohio),135-207
[11] J.伯杰。;Pericchi,L.,Bayes factors,(Wiley StatsRef:在线统计参考(2015)),1-14
[12] 巴顿,K.S。;约阿尼迪斯,J.P.A。;Mokrysz,C。;Nosek,B.A。;弗林特,J。;Robinson,E.S.J.,《停电:为什么小样本会破坏神经科学的可靠性》,《自然评论神经科学》,第14365-376页(2013年)
[13] 钱伯斯,C。;费雷多斯,E。;Muthukumaraswamy,S.D.博士。;Etchells,P.,不是“玩游戏”,而是改变规则的时候了:AIMS神经科学及其他领域的注册报告,AIMS神经学,1,4-17(2014)
[14] 科夫曼,L.C。;Niederle,M.,预分析计划的优势有限,尤其是在复制可行的情况下,《经济展望杂志》,29,3,81-98(2015)
[15] 科恩,J.,《异常社会心理学研究的统计力量:综述》,《异常与社会心理学杂志》,65,145-153(1962)
[16] Cohen,J.,《行为科学的统计力量分析》(1988),埃尔鲍姆:埃尔鲍姆-希尔斯代尔,新泽西州·Zbl 0747.62110号
[17] 达斯,S。;Berger,J.,复合假设的统一贝叶斯和条件频率测试,《斯堪的纳维亚统计杂志》,30193-210(2003)·Zbl 1034.62009年
[18] Dreber,A。;Pfeiffer,T。;Almenberg,J。;Isaksson,S。;威尔逊,B。;Chen,Y.,《使用预测市场评估科学研究的再现性》,《美国国家科学院学报》,第112、50、15343-15347页(2015年)
[19] 爱德华兹。;Lindman,H。;萨维奇,L.,《心理学研究的贝叶斯统计推断》,《心理学评论》,70,3,193-242(1963)·Zbl 0173.2004号
[21] 费希霍夫(Fischhoff,B.),《后见》(Hindsight),《远见》。结果知识对不确定性下判断的影响,《实验心理学杂志:人类感知与表现》,1,3,288-299(1975)
[22] 费希霍夫,B。;Beyth-Marom,R.,从贝叶斯的角度进行假设评估,《心理学评论》,90,3,239-260(1983)
[23] Garner,C.,全基因组关联研究中优势比估计值的向上偏差,遗传流行病学,31288-295(2007)
[24] 盖尔曼,A。;Carlin,J.,《超越权力计算:评估S型(符号)和M型(量级)错误》,《心理科学展望》,9,6,641-651(2014)
[25] 吉尔伯特,P。;J.伯杰。;Stablein博士。;贝克尔,S。;埃塞克斯,M。;Hammer,S.,《泰国RV144 HIV疫苗疗效试验的统计解释:疗效试验中统计问题的案例研究》,《传染病杂志》,203,7,969-975(2011)
[26] Ioanidis,J.P.A.,《为什么大多数公布的研究结果都是虚假的》,《公共科学图书馆·医学》,第2、8、124页(2005年)
[27] Ioannidis,J.P.A.,《正式统计显著性对观察协会可信度的影响》,《美国流行病学杂志》,168,4,374-383(2008)
[28] John,L.K。;Loewenstein,G。;Prelec,D.,《衡量有问题的研究实践的普遍性与真相推销的激励》,《心理科学》,第23、5、524-532页(2012年)
[29] Johnson,V.,《统计证据的修订标准》,《美国国家科学院院刊》,110、48、19313-19317(2013)·兹比尔1357.62025
[30] Kruschke,J.K.,通过参数估计和模型比较对零值进行贝叶斯评估,《心理科学展望》,6,3,299-312(2011)
[31] Locke,A.E.,《体重指数的遗传研究为肥胖生物学提供了新见解》,《自然》,518197-206(2015)
[32] Lucas,M.,《无关联语义启动:一项元分析综述》,《心理经济学通报与评论》,第6618-630页(2000年)
[33] Lucke,J.F.,《对假阳性报告概率的批判》,《遗传流行病学》,第33期,第145-150页(2009年)
[34] Masson,M.E.J.,《关于无假设显著性测试的实用贝叶斯替代方法的教程》,《行为研究》,43,679-690(2011)
[35] Neyman,J.,《频率概率与频率统计》,《综合》,第36期,第97-131页(1977年)·兹比尔0372.60002
[36] Olken,B.,预分析计划的承诺和风险,《经济展望杂志》,29,3,61-80(2015)
[37] F.D.理查德。;债券,C.F。;Stokes-Zoota,J.J.,《社会心理学一百年的定量描述》,《普通心理学评论》,2003年第7期,第4期,第331-363页
[38] Rietveld,C.A.,126559个人的GWAS确定了与教育程度相关的遗传变异,《科学》,340,6139,1467-1471(2013)
[39] Rietveld,C.A.,行为特征全基因组关联研究的可复制性和稳健性,心理科学,25,11,1975-1986(2014)
[40] Ripke,S.,《108个精神分裂症相关基因位点的生物学见解》,《自然》,511421-427(2014)
[41] Rosenthal,R.,“文件抽屉问题”和对空结果的容忍,《心理公报》,86,3,641-838(1979)
[42] Schkade,D.A。;卡尼曼博士,生活在加州会让人幸福吗?生活满意度判断中的聚焦错觉,心理科学,9,5,340-346(1998)
[43] Sellke,T.M.,《关于(p)值的解释》,普渡大学统计系技术代表(2012)
[44] 塞尔克,T。;巴亚里,M.J。;Berger,J.O.,《检验精确零假设的p值校准》,《美国统计学家》,55,62-71(2001)·Zbl 1182.62053号
[45] Vankov,I。;鲍尔斯,J。;Munafó,M.R.,《论心理科学中低权力的持续存在》,《实验心理学季刊》,67,5,1037-1040(2014)
[46] Visscher,P.M。;Brown,医学硕士。;M.I.麦卡锡。;Yang,J.,GWAS发现的五年,《美国人类遗传学杂志》,90,1,7-24(2012)
[47] Vovk,V.G.,《概率逻辑及其在统计学基础上的应用》,《皇家统计学会杂志:B辑》,55,317-351(1993)·兹比尔0806.62004
[48] Wacholder,S。;Chanock,S。;Garcia-Closas,M。;El ghormli,L。;Rothman,N.,《评估阳性报告为假的概率:分子流行病学研究的方法》,《国家癌症研究所杂志》,96,6,434-442(2004)
[50] Wagenmakers,E.-J。;韦策尔斯,R。;Borsboom博士。;van der Maas,H.L.J.,《为什么心理学家必须改变他们分析数据的方式:psi案例:Bem评论》(2011),《个性与社会心理学杂志》,100426-432(2011)
[51] 《七种常见疾病14000例和3000例共享对照的全基因组关联研究》,Nature,447,7145,661-678(2007)
[52] Wood,A.R.,《定义常见变异在成人身高基因组和生物结构中的作用》,自然遗传学,461173-1186(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。