×

依赖性下错误发现率控制的条件校准。 (英语) Zbl 07641119号

摘要:我们介绍了一类新的有限样本错误发现率(FDR)控制方法,用于具有相依测试统计量且相依性已知的多个测试问题。我们的方法分别为每个假设校准数据相关值拒绝阈值,根据需要放宽或收紧阈值以实现精确的FDR控制。除了我们的一般框架之外,我们还提出了一个具体的算法,即依赖性调整的Benjamini-Hochberg(dBH)程序,该程序为每个假设设置BH-调整的p值阈值。在正回归相关性下,dBH程序统一控制标准BH程序,通常它统一控制Benjamini-Yekutieli(BY)程序(也称为带对数校正的BH),这对最坏情况相关性进行了保守调整。仿真和实际数据示例表明,在这两种方法都适用的情况下,与BY程序相比,BY程序具有显著的功率增益,并且在仿冒设置下具有竞争力。当BH程序根据经验控制FDR时(就像在实践中通常做的那样),dBH程序的性能相当。

MSC公司:

62F03型 参数假设检验
62G10型 非参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] BARBER,R.F.和CANDÉS,E.J.(2015年)。通过仿冒品控制错误发现率。安。统计师。43 2055-2085. ·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[2] BARBER,R.F.和RAMDAS,A.(2017年)。过滤器:分组假设的多层错误发现率控制。J.R.统计社会服务。B.统计方法。79 1247-1268. ·Zbl 1373.62041号 ·doi:10.1111/rssb.12218
[3] BENJAMINI,Y.和BOGOMOLOV,M.(2014)。对多个假设家族的选择性推断。J.R.统计社会服务。B.统计方法。76 297-318之间·Zbl 1411.62221号 ·doi:10.1111/rssb.12028
[4] Benjamini,Y.和Heller,R.(2008)。部分连接假设的筛选。生物计量学64 1215-1222. ·Zbl 1152.62045号 ·doi:10.1111/j.1541-0420.2007.00984.x
[5] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B57 289-300. ·Zbl 0809.62014号
[6] BENJAMINI,Y.和HOCHBERG,Y.(1997年)。使用权重进行多重假设测试。扫描。J.统计。24 407-418. ·Zbl 1090.62548号 ·数字对象标识代码:10.1111/1467-9469.00072
[7] BENJAMINI,Y.、KRIEGER,A.M.和YEKUTIELI,D.(2006年)。控制错误发现率的自适应线性加速过程。生物特征93 491-507. ·Zbl 1108.62069号 ·doi:10.1093/biomet/93.3.491
[8] BENJAMINI,Y.和YEKUTIELI,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[9] BLANCHARD,G.和ROQUAIN,E.(2008)。FDR控制的两个简单充分条件。电子。J.统计。2 963-992·Zbl 1320.62179号 ·doi:10.1214/08-EJS180
[10] 布兰查德(G.Blanchard)和罗奎恩(R.Roquin)。(2009). 独立性和依赖性下的自适应错误发现率控制。J.马赫。学习。物件。10 2837-2871. ·Zbl 1235.62093号
[11] BOCA,S.M.和LEEK,J.T.(2017年)。真实零假设比例的回归框架。预印本。生物Rxiv 35675。
[12] Brown,L.D.(1986)。统计指数族基础及其在统计决策理论中的应用.数理统计研究所讲义专题系列9.加州海沃德IMS·Zbl 0685.6202号
[13] Candès,E.、Fan,Y.、Janson,L.和Lv,J.(2018年)。淘金:高维可控变量选择的“X型”仿制品。J.R.统计社会服务。B.统计方法。80 551-577. ·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[14] Delatre,S.和Roquain,E.(2015年)。通过Romano-Wolf的启发式控制错误发现比例的新程序。安。统计师。43 1141-1177. ·Zbl 1320.62128号 ·doi:10.1214/14-AOS1302
[15] DOBRIBAN,E.、FORTNEY,K.、KIM,S.K.和OWEN,A.B.(2015)。高斯先验下的最优多重检验对效应大小的影响。生物特征102 753-766. ·Zbl 1419.62341号 ·doi:10.1093/biomet/asv050
[16] Fan,J.和Han,X.(2017)。具有未知相关性的错误发现比例的估计。J.R.统计社会服务。B.统计方法。79 1143-1164. ·Zbl 1373.62272号 ·doi:10.1111/rssb.12204
[17] Fan,J.、Han,X.和Gu,W.(2012)。估计任意协方差依赖下的错误发现比例。J.Amer。统计师。协会。107 1019-1035. ·Zbl 1395.62219号 ·doi:10.1080/016214592012.720478
[18] FARCOMENI,A.(2006年)。更强大的控制依赖性下的错误发现率。统计方法应用。15 43-73. ·Zbl 1187.62130号 ·数字对象标识码:10.1007/s10260-006-0002-z
[19] FARCOMENI,A.(2007年)。关于依赖性下错误发现率控制的一些结果。扫描。J.统计。34 275-297. ·兹比尔1142.62048 ·网址:10.1111/j.1467-9469.2006.00530.x
[20] FERREIRA,J.A.和ZWINDERMAN,A.H.(2006)。关于Benjamini Hochberg方法。安。统计师。34 1827-1849. ·Zbl 1246.62170号 ·doi:10.1214/009053600000425
[21] FINNER,H.(1999)。逐步多重测试程序和方向误差控制。安。统计师。27 274-289. ·Zbl 0978.62057号 ·doi:10.1214/aos/1018031111
[22] FITHIAN,W.、SUN,D.和TAYLOR,J.(2014)。模型选择后的最优推理。ArXiv预印本。可从ArXiv:1410.2597获得。
[23] FITHIAN,W.和LEI,L.(2022)。补充“依赖性下错误发现率控制的条件校准”https://doi.org/10.1214/21-AOS2137SUPP网站
[24] GENOVESE,C.R.、ROEDER,K.和WASSERMAN,L.(2006)。具有\(p\)-值权重的错误发现控制。生物特征93 509-524. ·Zbl 1108.62070号 ·doi:10.1093/biomet/93.3509
[25] GENOVESE,C.和WASSERMAN,L.(2002)。错误发现率过程的操作特征和扩展。J.R.统计社会服务。B.统计方法。64 499-517. ·Zbl 1090.62072号 ·doi:10.1111/1467-9868.00347
[26] Genovese,C.和Wasserman,L.(2004)。一种用于错误发现控制的随机过程方法。安。统计师。32 1035-1061. ·Zbl 1092.62065号 ·doi:10.1214/009053604000000283
[27] Genovese,C.R.和Wasserman,L.(2006)。错误发现比例的超标控制。J.Amer。统计师。协会。101 1408-1417. ·Zbl 1171.62338号 ·doi:10.1198/016214500000339
[28] Guo,W.,He,L.和Sarkar,S.K.(2014)。关于控制错误发现比例的进一步结果。安。统计师。42 1070-1101. ·兹比尔1305.62271 ·doi:10.1214/14-AOS1214
[29] 郭伟(GUO,W.)和RAO,M.B.(2008)。在没有依赖性假设的情况下控制错误发现率。J.统计。计划。推断138 3176-3188. ·Zbl 1140.62060号 ·doi:10.1016/j.jspi.2008.01.003
[30] HELLER,R.和ROSSET,S.(2021年)。两组模型中错误发现准则的最优控制。J.R.统计社会服务。B.统计方法。83 133-155. ·Zbl 07555259号 ·doi:10.1111/rssb.12403
[31] IGNATIADIS,N.和HUBER,W.(2017年)。具有错误发现率控制的协变量加权多重测试。ArXiv预印本。可从ArXiv:1701.05179获得。
[32] IGNATIADIS,N.、KLAUS,B.、ZAUGG,J.B.和HUBER,W.(2016年)。数据驱动假设加权增加了基因组规模多重测试的检测能力。自然方法13 577-580.
[33] KIM,K.I.和VAN DE WIEL,M.A.(2008年)。高维多重测试问题中依赖性的影响。BMC生物信息。9 114. ·doi:10.1186/1471-2105-9-114
[34] Korn,E.L.、Troendle,J.F.、McShane,L.M.和Simon,R.(2004)。控制错误发现的数量:应用于高维基因组数据。J.统计。计划。推断124 379-398. ·Zbl 1074.62070号 ·doi:10.1016/S0378-3758(03)00211-8
[35] Lee,J.D.、Sun,D.L.、Sun,Y.和Taylor,J.E.(2016)。精确的后选择推理,并应用于套索。安。统计师。44 907-927. ·Zbl 1341.62061号 ·doi:10.1214/15-AOS1371
[36] Lehmann,E.L.(1966年)。依赖的一些概念。安。数学。斯达。37 1137-1153. ·兹伯利0146.40601 ·doi:10.1214/aoms/1177699260
[37] Lehmann,E.L.和Romano,J.P.(2005a)。家庭错误率的一般化。安。统计师。33 1138-1154. ·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[38] Lehmann,E.L.和Romano,J.P.(2005年b)。测试统计假设,第3版。统计中的Springer文本纽约州施普林格·2018年6月17日
[39] LEHMANN,E.L.和SCHEFFé,H.(1955)。完整性、相似区域和无偏估计。二、。桑基拉15 219-236. ·Zbl 0068.12907号 ·doi:10.1007/978-1-4614-1412-424
[40] LEI,L.和FITHIAN,W.(2018年)。AdaPT:一种交互式程序,用于附带信息的多次测试。J.R.统计社会服务。B.统计方法。80 649-679. ·Zbl 1398.62049号 ·doi:10.1111/rssb.12253
[41] Li,A.和Barber,R.F.(2019年)。使用结构自适应Benjamini-Hochberg算法进行多次测试。J.R.统计社会服务。B.统计方法。81 45-74. ·Zbl 1407.62284号
[42] LYNCH,G.和GUO,W.(2016)。关于控制FDR的程序,以测试层次有序的假设。ArXiv预印本。可从ArXiv:1612.04467获得。
[43] 欧文·A·B(2005)。错误发现数量的方差。J.R.统计社会服务。B.统计方法。67 411-426·Zbl 1069.62102号 ·数字对象标识代码:10.1111/j.1467-9868.200500509.x
[44] PATTERSON,E.和SESIA,M.(2018年)。敲除:受控变量选择的敲除过滤器。R包版本0.3.2。
[45] PERONE PACIFICO,M.、GENOVESE,C.、VERDINELLI,I.和WASSERMAN,L.(2004)。随机字段的错误发现控制。J.Amer。统计师。协会。99 1002-1014. ·兹比尔1055.62105 ·doi:10.1198/016214500001655
[46] RHEE,S.-Y.,FESSEL,W.J.,ZOLOPA,A.R.,HURLEY,L.,LIU,T.,TAYLOR,J.,NGUYEN,D.P.,SLOME,S.,KLEIN,D.等人(2005年)。HIV-1蛋白酶和逆转录酶突变:B亚型分离株抗逆转录病毒治疗的相关性及其对耐药性监测的意义。J.感染。疾病。192 456-465.
[47] Rhee,S.-Y.、Taylor,J.、Wadhera,G.、Ben-Hur,A.、Brutlag,D.L.和Shafer,R.W.(2006)。人类免疫缺陷病毒1型耐药性的基因型预测因子。程序。国家。阿卡德。科学。美国103 17355-17360.
[48] ROMANO,J.P.、SHAIKH,A.M.和WOLF,M.(2008)。使用引导和子采样控制依赖性下的错误发现率。测试17 417-442. ·Zbl 1367.62233号 ·doi:10.1007/s11749-008-0126-6
[49] ROQUAIN,E.和VAN DE WIEL,M.A.(2009年)。错误发现率控制的最佳加权。电子。J.统计。3 678-711. ·Zbl 1326.62164号 ·doi:10.1214/09-EJS430
[50] ROQUAIN,E.和VILLERS,F.(2011)。准确计算错误发现比例,并应用于最不利的配置。安。统计师。39 584-612. ·Zbl 1209.62164号 ·doi:10.1214/10-AOS847
[51] SARKAR,S.K.(2002)。关于逐步多重测试过程中错误发现率的一些结果。安。统计师。30 239-257. ·Zbl 1101.62349号 ·doi:10.1214/aos/1015362192
[52] SARKAR,S.K.和TANG,C.Y.(2021)。调整Benjamini Hochberg方法以控制敲除辅助变量选择中的错误发现率。ArXiv预印本。可从ArXiv:2102.09080获得。
[53] SHAFFER,J.P.(1980)。采用分段多重测试程序控制方向误差。安。统计师。8 1342-1347. ·Zbl 0484.62089号
[54] Storey,J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B.统计方法。64 479-498. ·兹比尔1090.62073 ·doi:10.1111/1467-9868.00346
[55] Storey,J.D.(2003)。阳性错误发现率:贝叶斯解释和\(q\)-值。安。统计师。31 2013-2035. ·Zbl 1042.62026 ·doi:10.1214/aos/1074290335
[56] STOREY,J.D.、TAYLOR,J.E.和SIEGMUND,D.(2004)。强控制、保守点估计和错误发现率的同时保守一致性:统一方法。J.R.统计社会服务。B.统计方法。66 187-205. ·Zbl 1061.62110号 ·文件编号:10.1111/j.1467-9868.2004.00439.x
[57] SUN,W.和CAI,T.T.(2007)。Oracle和自适应复合决策规则用于错误发现率控制。J.Amer。统计师。协会。102 901-912. ·Zbl 1469.62318号 ·doi:10.1198/0162145000000545
[58] SUN,W.和CAI,T.T.(2009)。依赖性下的大规模多重测试。J.R.统计社会服务。B.统计方法。71 393-424. ·Zbl 1248.62005号 ·doi:10.1111/j.1467-9868.2008.00694.x
[59] TANSEY,W.、WANG,Y.、BLEI,D.和RABADAN,R.(2018)。黑盒FDR。机器学习国际会议4867-4876. PMLR公司。
[60] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B58 267-288. ·Zbl 0850.62538号
[61] Tibshirani,R.J.、Taylor,J.、Lockhart,R.和Tibshirani,R.(2016)。序列回归程序的精确选择后推断。J.Amer。统计师。协会。111 600-620. ·doi:10.1080/01621459.2015.1108848
[62] 特伦德尔,J.F.(2000)。逐步正态理论多重测试程序控制错误发现率。J.统计。计划。推断84 139-158. ·Zbl 1131.62310号 ·doi:10.1016/S0378-3758(99)00145-7
[63] Weinstein,A.、Fithian,W.和Benjamini,Y.(2013)。选择调整的置信区间具有更大的确定符号的能力。J.Amer。统计师。协会。108 165-176. ·Zbl 06158333号 ·doi:10.1080/016214592012.737740
[64] 夏芳、张明杰、邹建勇和TSE,D.(2017)。Neuralfdr:从假设特征中学习发现阈值。神经信息处理系统研究进展1541-1550年。
[65] Xie,J.、Cai,T.T.、Maris,J.和Li,H.(2011)。相关数据的最佳错误发现率控制。统计接口4 417-430. ·Zbl 1245.62091号 ·doi:10.4310/SII.2011.v4.n4.a1
[66] YEKUTIELI,D.和BENJAMINI,Y.(1999)。基于重采样的错误发现率控制相关测试统计的多个测试过程。J.统计。计划。推断82 171-196 ·Zbl 1063.62563号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。