文件Zbl 07641119-zbMATH打开

依赖性下错误发现率控制的条件校准。（英语） Zbl 07641119号

《美国统计年鉴》。 50，第6号，3091-3118（2022）.

摘要：我们介绍了一类新的有限样本错误发现率（FDR）控制方法，用于具有相依测试统计量且相依性已知的多个测试问题。我们的方法分别为每个假设校准数据相关值拒绝阈值，根据需要放宽或收紧阈值以实现精确的FDR控制。除了我们的一般框架之外，我们还提出了一个具体的算法，即依赖性调整的Benjamini-Hochberg（dBH）程序，该程序为每个假设设置BH-调整的p值阈值。在正回归相关性下，dBH程序统一控制标准BH程序，通常它统一控制Benjamini-Yekutieli（BY）程序（也称为带对数校正的BH），这对最坏情况相关性进行了保守调整。仿真和实际数据示例表明，在这两种方法都适用的情况下，与BY程序相比，BY程序具有显著的功率增益，并且在仿冒设置下具有竞争力。当BH程序根据经验控制FDR时（就像在实践中通常做的那样），dBH程序的性能相当。

引用于5文件

MSC公司：

62F03型	参数假设检验
62G10型	非参数假设检验

关键词：

错误发现率;多次测试;相关测试统计;Benjamini-Hochberg程序

软件：

自适应MT;AdaPT公司;仿冒品

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

参考文献：

[1]	BARBER，R.F.和CANDÉS，E.J.（2015年）。通过仿冒品控制错误发现率。安。统计师。43 2055-2085. ·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[2]	BARBER，R.F.和RAMDAS，A.（2017年）。过滤器：分组假设的多层错误发现率控制。J.R.统计社会服务。B.统计方法。79 1247-1268. ·Zbl 1373.62041号 ·doi:10.1111/rssb.12218
[3]	BENJAMINI，Y.和BOGOMOLOV，M.（2014）。对多个假设家族的选择性推断。J.R.统计社会服务。B.统计方法。76 297-318之间·Zbl 1411.62221号 ·doi:10.1111/rssb.12028
[4]	Benjamini，Y.和Heller，R.（2008）。部分连接假设的筛选。生物计量学64 1215-1222. ·Zbl 1152.62045号 ·doi:10.1111/j.1541-0420.2007.00984.x
[5]	Benjamini，Y.和Hochberg，Y.（1995年）。控制错误发现率：一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B57 289-300. ·Zbl 0809.62014号
[6]	BENJAMINI，Y.和HOCHBERG，Y.（1997年）。使用权重进行多重假设测试。扫描。J.统计。24 407-418. ·Zbl 1090.62548号 ·数字对象标识代码：10.1111/1467-9469.00072
[7]	BENJAMINI，Y.、KRIEGER，A.M.和YEKUTIELI，D.（2006年）。控制错误发现率的自适应线性加速过程。生物特征93 491-507. ·Zbl 1108.62069号 ·doi:10.1093/biomet/93.3.491
[8]	BENJAMINI，Y.和YEKUTIELI，D.（2001年）。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[9]	BLANCHARD，G.和ROQUAIN，E.（2008）。FDR控制的两个简单充分条件。电子。J.统计。2 963-992·Zbl 1320.62179号 ·doi:10.1214/08-EJS180
[10]	布兰查德（G.Blanchard）和罗奎恩（R.Roquin）。(2009). 独立性和依赖性下的自适应错误发现率控制。J.马赫。学习。物件。10 2837-2871. ·Zbl 1235.62093号
[11]	BOCA，S.M.和LEEK，J.T.（2017年）。真实零假设比例的回归框架。预印本。生物Rxiv 35675。
[12]	Brown，L.D.（1986）。统计指数族基础及其在统计决策理论中的应用.数理统计研究所讲义专题系列9.加州海沃德IMS·Zbl 0685.6202号
[13]	Candès，E.、Fan，Y.、Janson，L.和Lv，J.（2018年）。淘金：高维可控变量选择的“X型”仿制品。J.R.统计社会服务。B.统计方法。80 551-577. ·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[14]	Delatre，S.和Roquain，E.（2015年）。通过Romano-Wolf的启发式控制错误发现比例的新程序。安。统计师。43 1141-1177. ·Zbl 1320.62128号 ·doi:10.1214/14-AOS1302
[15]	DOBRIBAN，E.、FORTNEY，K.、KIM，S.K.和OWEN，A.B.（2015）。高斯先验下的最优多重检验对效应大小的影响。生物特征102 753-766. ·Zbl 1419.62341号 ·doi:10.1093/biomet/asv050
[16]	Fan，J.和Han，X.（2017）。具有未知相关性的错误发现比例的估计。J.R.统计社会服务。B.统计方法。79 1143-1164. ·Zbl 1373.62272号 ·doi:10.1111/rssb.12204
[17]	Fan，J.、Han，X.和Gu，W.（2012）。估计任意协方差依赖下的错误发现比例。J.Amer。统计师。协会。107 1019-1035. ·Zbl 1395.62219号 ·doi:10.1080/016214592012.720478
[18]	FARCOMENI，A.（2006年）。更强大的控制依赖性下的错误发现率。统计方法应用。15 43-73. ·Zbl 1187.62130号 ·数字对象标识码：10.1007/s10260-006-0002-z
[19]	FARCOMENI，A.（2007年）。关于依赖性下错误发现率控制的一些结果。扫描。J.统计。34 275-297. ·兹比尔1142.62048 ·网址：10.1111/j.1467-9469.2006.00530.x
[20]	FERREIRA，J.A.和ZWINDERMAN，A.H.（2006）。关于Benjamini Hochberg方法。安。统计师。34 1827-1849. ·Zbl 1246.62170号 ·doi:10.1214/009053600000425
[21]	FINNER，H.（1999）。逐步多重测试程序和方向误差控制。安。统计师。27 274-289. ·Zbl 0978.62057号 ·doi:10.1214/aos/1018031111
[22]	FITHIAN，W.、SUN，D.和TAYLOR，J.（2014）。模型选择后的最优推理。ArXiv预印本。可从ArXiv:1410.2597获得。
[23]	FITHIAN，W.和LEI，L.（2022）。补充“依赖性下错误发现率控制的条件校准”https://doi.org/10.1214/21-AOS2137SUPP网站
[24]	GENOVESE，C.R.、ROEDER，K.和WASSERMAN，L.（2006）。具有\（p\）-值权重的错误发现控制。生物特征93 509-524. ·Zbl 1108.62070号 ·doi:10.1093/biomet/93.3509
[25]	GENOVESE，C.和WASSERMAN，L.（2002）。错误发现率过程的操作特征和扩展。J.R.统计社会服务。B.统计方法。64 499-517. ·Zbl 1090.62072号 ·doi:10.1111/1467-9868.00347
[26]	Genovese，C.和Wasserman，L.（2004）。一种用于错误发现控制的随机过程方法。安。统计师。32 1035-1061. ·Zbl 1092.62065号 ·doi:10.1214/009053604000000283
[27]	Genovese，C.R.和Wasserman，L.（2006）。错误发现比例的超标控制。J.Amer。统计师。协会。101 1408-1417. ·Zbl 1171.62338号 ·doi:10.1198/016214500000339
[28]	Guo，W.，He，L.和Sarkar，S.K.（2014）。关于控制错误发现比例的进一步结果。安。统计师。42 1070-1101. ·兹比尔1305.62271 ·doi:10.1214/14-AOS1214
[29]	郭伟（GUO，W.）和RAO，M.B.（2008）。在没有依赖性假设的情况下控制错误发现率。J.统计。计划。推断138 3176-3188. ·Zbl 1140.62060号 ·doi:10.1016/j.jspi.2008.01.003
[30]	HELLER，R.和ROSSET，S.（2021年）。两组模型中错误发现准则的最优控制。J.R.统计社会服务。B.统计方法。83 133-155. ·Zbl 07555259号 ·doi:10.1111/rssb.12403
[31]	IGNATIADIS，N.和HUBER，W.（2017年）。具有错误发现率控制的协变量加权多重测试。ArXiv预印本。可从ArXiv:1701.05179获得。
[32]	IGNATIADIS，N.、KLAUS，B.、ZAUGG，J.B.和HUBER，W.（2016年）。数据驱动假设加权增加了基因组规模多重测试的检测能力。自然方法13 577-580.
[33]	KIM，K.I.和VAN DE WIEL，M.A.（2008年）。高维多重测试问题中依赖性的影响。BMC生物信息。9 114. ·doi:10.1186/1471-2105-9-114
[34]	Korn，E.L.、Troendle，J.F.、McShane，L.M.和Simon，R.（2004）。控制错误发现的数量：应用于高维基因组数据。J.统计。计划。推断124 379-398. ·Zbl 1074.62070号 ·doi:10.1016/S0378-3758（03）00211-8
[35]	Lee，J.D.、Sun，D.L.、Sun，Y.和Taylor，J.E.（2016）。精确的后选择推理，并应用于套索。安。统计师。44 907-927. ·Zbl 1341.62061号 ·doi:10.1214/15-AOS1371
[36]	Lehmann，E.L.（1966年）。依赖的一些概念。安。数学。斯达。37 1137-1153. ·兹伯利0146.40601 ·doi:10.1214/aoms/1177699260
[37]	Lehmann，E.L.和Romano，J.P.（2005a）。家庭错误率的一般化。安。统计师。33 1138-1154. ·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[38]	Lehmann，E.L.和Romano，J.P.（2005年b）。测试统计假设，第3版。统计中的Springer文本纽约州施普林格·2018年6月17日
[39]	LEHMANN，E.L.和SCHEFFé，H.（1955）。完整性、相似区域和无偏估计。二、。桑基拉15 219-236. ·Zbl 0068.12907号 ·doi:10.1007/978-1-4614-1412-424
[40]	LEI，L.和FITHIAN，W.（2018年）。AdaPT：一种交互式程序，用于附带信息的多次测试。J.R.统计社会服务。B.统计方法。80 649-679. ·Zbl 1398.62049号 ·doi:10.1111/rssb.12253
[41]	Li，A.和Barber，R.F.（2019年）。使用结构自适应Benjamini-Hochberg算法进行多次测试。J.R.统计社会服务。B.统计方法。81 45-74. ·Zbl 1407.62284号
[42]	LYNCH，G.和GUO，W.（2016）。关于控制FDR的程序，以测试层次有序的假设。ArXiv预印本。可从ArXiv:1612.04467获得。
[43]	欧文·A·B（2005）。错误发现数量的方差。J.R.统计社会服务。B.统计方法。67 411-426·Zbl 1069.62102号 ·数字对象标识代码：10.1111/j.1467-9868.200500509.x
[44]	PATTERSON，E.和SESIA，M.（2018年）。敲除：受控变量选择的敲除过滤器。R包版本0.3.2。
[45]	PERONE PACIFICO，M.、GENOVESE，C.、VERDINELLI，I.和WASSERMAN，L.（2004）。随机字段的错误发现控制。J.Amer。统计师。协会。99 1002-1014. ·兹比尔1055.62105 ·doi:10.1198/016214500001655
[46]	RHEE，S.-Y.，FESSEL，W.J.，ZOLOPA，A.R.，HURLEY，L.，LIU，T.，TAYLOR，J.，NGUYEN，D.P.，SLOME，S.，KLEIN，D.等人（2005年）。HIV-1蛋白酶和逆转录酶突变：B亚型分离株抗逆转录病毒治疗的相关性及其对耐药性监测的意义。J.感染。疾病。192 456-465.
[47]	Rhee，S.-Y.、Taylor，J.、Wadhera，G.、Ben-Hur，A.、Brutlag，D.L.和Shafer，R.W.（2006）。人类免疫缺陷病毒1型耐药性的基因型预测因子。程序。国家。阿卡德。科学。美国103 17355-17360.
[48]	ROMANO，J.P.、SHAIKH，A.M.和WOLF，M.（2008）。使用引导和子采样控制依赖性下的错误发现率。测试17 417-442. ·Zbl 1367.62233号 ·doi:10.1007/s11749-008-0126-6
[49]	ROQUAIN，E.和VAN DE WIEL，M.A.（2009年）。错误发现率控制的最佳加权。电子。J.统计。3 678-711. ·Zbl 1326.62164号 ·doi:10.1214/09-EJS430
[50]	ROQUAIN，E.和VILLERS，F.（2011）。准确计算错误发现比例，并应用于最不利的配置。安。统计师。39 584-612. ·Zbl 1209.62164号 ·doi:10.1214/10-AOS847
[51]	SARKAR，S.K.（2002）。关于逐步多重测试过程中错误发现率的一些结果。安。统计师。30 239-257. ·Zbl 1101.62349号 ·doi:10.1214/aos/1015362192
[52]	SARKAR，S.K.和TANG，C.Y.（2021）。调整Benjamini Hochberg方法以控制敲除辅助变量选择中的错误发现率。ArXiv预印本。可从ArXiv:2102.09080获得。
[53]	SHAFFER，J.P.（1980）。采用分段多重测试程序控制方向误差。安。统计师。8 1342-1347. ·Zbl 0484.62089号
[54]	Storey，J.D.（2002）。错误发现率的直接方法。J.R.统计社会服务。B.统计方法。64 479-498. ·兹比尔1090.62073 ·doi:10.1111/1467-9868.00346
[55]	Storey，J.D.（2003）。阳性错误发现率：贝叶斯解释和\（q\）-值。安。统计师。31 2013-2035. ·Zbl 1042.62026 ·doi:10.1214/aos/1074290335
[56]	STOREY，J.D.、TAYLOR，J.E.和SIEGMUND，D.（2004）。强控制、保守点估计和错误发现率的同时保守一致性：统一方法。J.R.统计社会服务。B.统计方法。66 187-205. ·Zbl 1061.62110号 ·文件编号：10.1111/j.1467-9868.2004.00439.x
[57]	SUN，W.和CAI，T.T.（2007）。Oracle和自适应复合决策规则用于错误发现率控制。J.Amer。统计师。协会。102 901-912. ·Zbl 1469.62318号 ·doi:10.1198/0162145000000545
[58]	SUN，W.和CAI，T.T.（2009）。依赖性下的大规模多重测试。J.R.统计社会服务。B.统计方法。71 393-424. ·Zbl 1248.62005号 ·doi:10.1111/j.1467-9868.2008.00694.x
[59]	TANSEY，W.、WANG，Y.、BLEI，D.和RABADAN，R.（2018）。黑盒FDR。在机器学习国际会议4867-4876. PMLR公司。
[60]	Tibshirani，R.（1996）。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B58 267-288. ·Zbl 0850.62538号
[61]	Tibshirani，R.J.、Taylor，J.、Lockhart，R.和Tibshirani，R.（2016）。序列回归程序的精确选择后推断。J.Amer。统计师。协会。111 600-620. ·doi:10.1080/01621459.2015.1108848
[62]	特伦德尔，J.F.（2000）。逐步正态理论多重测试程序控制错误发现率。J.统计。计划。推断84 139-158. ·Zbl 1131.62310号 ·doi:10.1016/S0378-3758（99）00145-7
[63]	Weinstein，A.、Fithian，W.和Benjamini，Y.（2013）。选择调整的置信区间具有更大的确定符号的能力。J.Amer。统计师。协会。108 165-176. ·Zbl 06158333号 ·doi:10.1080/016214592012.737740
[64]	夏芳、张明杰、邹建勇和TSE，D.（2017）。Neuralfdr：从假设特征中学习发现阈值。在神经信息处理系统研究进展1541-1550年。
[65]	Xie，J.、Cai，T.T.、Maris，J.和Li，H.（2011）。相关数据的最佳错误发现率控制。统计接口4 417-430. ·Zbl 1245.62091号 ·doi:10.4310/SII.2011.v4.n4.a1
[66]	YEKUTIELI，D.和BENJAMINI，Y.（1999）。基于重采样的错误发现率控制相关测试统计的多个测试过程。J.统计。计划。推断82 171-196 ·Zbl 1063.62563号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

依赖性下错误发现率控制的条件校准。（英语） Zbl 07641119号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

依赖性下错误发现率控制的条件校准。 （英语） Zbl 07641119号

MSC公司：

关键词：

软件：

参考文献：

依赖性下错误发现率控制的条件校准。（英语） Zbl 07641119号