×

当许多(p)值一致保守时进行多重测试,用于测试教育干预中的定性交互作用。 (英文) Zbl 1428.62348号

小结:在评估治疗效果时,了解治疗对某些人是否有益,对其他人是否有害,这是一种被称为定性相互作用的现象,这是重要的政策利益所在。我们将这个问题描述为一个具有许多保守零值的多重测试问题,其中经典的多重测试方法可能会严重失效。我们提出了一种简单的技术——调节——来提高功率。我们需要的一个关键假设是一致保守性,这意味着对于任何保守值(p),条件分布((p/τ)|p\leq\tau)随机大于任何(τ)在(0,1)上的一致分布。我们证明了这一性质适用于一维指数族中的单边检验(例如,定性相互作用的检验)以及使用统计量(Y\sim\mathrm{N}(\mu,1))进行的检验(例如使用阈值(\eta)进行实际重要性的检验)。我们提出了一种选择阈值的自适应方法。我们的理论和模拟结果表明,当许多(p)值一致保守时,所提出的测试获得了显著的功率,而当无(p)数值一致保守时则几乎没有功率损失。我们将我们的方法应用于两个教育干预数据集。

MSC公司:

62J15型 配对和多重比较;多次测试
62F03型 参数假设检验
第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿里亚斯·卡斯特罗,E。;坎迪斯,E.J。;Plan,Y.,《稀疏替代方案下的全球测试:方差分析,多重比较和更高的批评》,《统计年鉴》,39,2533-2556(2011)·Zbl 1231.62136号
[2] Bangert-Drowns,R.L。;M.M.赫尔利。;Wilkinson,B.,《基于学校的写作-学习干预对学业成绩的影响:元分析》,《教育研究评论》,74,29-58(2004)
[3] Benjamini,Y.,《同时和选择性推理:当前的成功和未来的挑战》,《生物医学杂志》,52708-721(2010)·兹比尔1208.62111
[4] Benjamini,Y.和Hochberg,Y.(1995),“控制错误发现率:一种实用且强大的多重测试方法”英国皇家统计学会杂志,B系列,57,289-300·Zbl 0809.62014号
[5] Berger,R.L.,《多参数假设检验和验收抽样》,技术计量学,24295-300(1982)·Zbl 0497.62091号
[6] Bloom,H.S.、Raudenbush,S.W.、Weiss,M.J.和Porter,K.(2017),“使用多站点实验研究处理效果的跨站点变化:具有固定截距和随机处理系数的混合方法”教育有效性研究杂志, 10, 817-842.
[7] Chernozhukov,V.、Chetverikov,D.和Kato,K.(2013),“测试许多矩不等式”,arXiv:1312.7186。
[8] 库珀,H。;J.C.瓦伦丁。;查尔顿,K。;Melson,A.,《修改后的学校日历对学生成绩以及学校和社区态度的影响》,《教育研究评论》,73,1-52(2003)
[9] CRASH-2合作者,《早期使用氨甲环酸治疗出血性创伤患者的重要性:CRASH-1随机对照试验的探索性分析》,《柳叶刀》,3771096-1101(2011)
[10] Cronbach,L.J.和Snow,R.E.(1977),能力和教学方法:互动研究手册纽约:欧文顿。
[11] 多诺霍博士。;Jin,J.,《检测稀疏非均匀混合物的更高批评》,《统计年鉴》,32962-994(2004)·兹比尔1092.62051
[12] Fan,J.、Hall,P.和Yao,Q.(2007),“对于多少同步假设测试可以正常使用,学生t或引导校准?”美国统计协会杂志, 102, 1282-1288. ·Zbl 1332.62063号
[13] Fisher,R.A.(1925),研究人员的统计方法英国爱丁堡:Oliver和Boyd。
[14] Fithian,W.、Sun,D.和Taylor,J.(2014),“模型选择后的最佳推断”,arXiv:1410.2597。
[15] 盖尔,M。;Simon,R.,《治疗效果和患者亚群之间的定性相互作用测试》,生物计量学,41361-372(1985)·Zbl 0614.62140号
[16] Hansen,P.R.,《卓越预测能力的测试》,《商业与经济统计杂志》,23365-380(2005)
[17] 海勒,R。;罗森鲍姆,P.R。;Small,D.S.,观测研究中的分离样本和设计敏感性,美国统计协会杂志,1041090-1101(2009)·Zbl 1388.62231号
[18] Holm,S.,《简单序贯拒绝多重检验程序》,《斯堪的纳维亚统计杂志》,第6期,第65-70页(1979年)·Zbl 0402.62058号
[19] Konstantopoulos,S.,《三水平荟萃分析中的固定效应和方差分量估计》,研究综合方法,261-76(2011)
[20] Lehmann,E.,《检验多参数假设》,《数理统计年鉴》,第23期,第541-552页(1952年)·Zbl 0048.11702号
[21] Lei,L.、Ramdas,A.和Fithian,W.(2017),“STAR:结构约束下FDR控制的通用交互框架”,arXiv:1710.02776·Zbl 07458253号
[22] 潘·G。;Wolfe,D.A.,《临床意义的定性相互作用测试》,《医学统计学》,第16期,1645-1652页(1997年)
[23] 披萨,G。;皮瓦,L。;科拉维塔,M。;费里,S。;Artusi,R。;Boracchi,P。;Parmiani,G。;Marubini,E.,Robson II期和III期肾细胞癌根治性肾切除术的干扰素佐剂:一项多中心随机研究,临床肿瘤学杂志,19,425-431(2001)
[24] 罗曼诺,J.P。;谢赫,A.M。;Wolf,M.,《检验力矩不等式的实用Twostep方法》,《计量经济学》,821979-2002(2014)·Zbl 1410.62044号
[25] Rosenbaum,P.R.(2002),观察研究纽约:Springer·Zbl 0985.62091号
[26] Schochet,P.Z.、Puma,M.和Deke,J.(2014),“了解教育影响评估中治疗效果的变化:定量方法概述”,报告编号NCEE 2014-4017,美国教育部,教育科学研究所,国家教育评估和区域援助中心。
[27] Šidák,Z.,多元正态分布均值的矩形置信区间,美国统计协会杂志,62626-633(1967)·Zbl 0158.17705号
[28] Simes,R.J.,《多个显著性检验的改良Bonferroni程序》,生物统计学,73751-754(1986)·Zbl 0613.62067号
[29] Sun,W。;Mclain,A.C.,异方差模型中复合零假设的多重检验,美国统计协会杂志,107,673-687(2012)·Zbl 1261.62016年
[30] Viechtbauer,W.,使用Metafor包在R中进行Meta-分析,统计软件杂志,36,1-48(2010)
[31] 王,R。;拉加科斯,S.W。;Ware,J.H。;亨特·D·J。;Drazen,J.M.,临床试验中亚组分析的药物报告统计,新英格兰医学杂志,357,2189-2194(2007)
[32] Whitt,W.,统一条件随机序,应用概率杂志,17,112-123(1980)
[33] Wiens,B.L.(2003),“测试多个端点的固定序列Bonferroni程序”药物统计学, 2, 211-215.
[34] Wright,S.P.,调整后第页-同时推断的值,生物统计学,481005-1013(1992)
[35] Yu,L.,Suh,E.-Y.和Pan,G.(2014),QualInt:定性互动测试,R软件包版本1.0.0,可从.
[36] Zaykin,D.V.、Zhivotovsky,L.A.、Westfall,P.H.和Weir,B.S.(2002),“组合P值的截断乘积法”遗传流行病学, 22, 170-185.
[37] 赵琦(2017),“关于配对观测研究的敏感性值”美国统计协会杂志,已接受。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。