×

使用参考族对假阳性的事后置信界限。 (英语) Zbl 1450.62038号

超高维数据分析是众多应用领域中的一项重要任务。“事后选择”(或事后)推断是统计数据分析中的常见做法。本文的主要贡献是引入了一类参考拒绝集,以及该族上的联合族错误率标准。提出并验证了控制该速率的稳健程序。

MSC公司:

62G10型 非参数假设检验
62H15型 多元分析中的假设检验
62兰特 大数据和数据科学的统计方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arlot,S.、Blanchard,G.和Roquain,E.(2010年)。高维重采样的一些非共鸣结果。二、。多次测试。安。统计师。38 83-99. ·Zbl 1181.62055号 ·doi:10.1214/08-AOS668
[2] Bachoc,F.、Preinerstorfer,D.和Steinberger,L.(2019年)。模型选择后统一有效的置信区间。Ann.Statist公司。出现·Zbl 1466.62263号 ·doi:10.1214/19-AOS1815
[3] Belloni,A.、Chernozhukov,V.和Hansen,C.(2014)。在高维对照中选择后对治疗效果的推断。经济收益率。螺柱81 608-650·Zbl 1409.62142号 ·doi:10.1093/restud/rdt044
[4] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用而强大的多重测试方法。J.罗伊。统计师。Soc.序列号。乙57 289-300·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[5] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[6] Benjamini,Y.和Yekutieli,D.(2005)。错误发现率调整了选定参数的多个置信区间。J.Amer。统计师。协会100 71-93。带着作者的评论和反驳·Zbl 1117.62302号 ·doi:10.19198/0162114504000001907
[7] Berk,R.、Brown,L.、Buja,A.、Zhang,K.和Zhao,L.(2013)。有效的后选择推理。安。统计师。41 802-837. ·Zbl 1267.62080号 ·doi:10.1214/12-AOS1077
[8] Blanchard,G.、Neuvial,P.和Roquain,E.(2019年)。R包无Souci版本0.8.0。https://github.com/pneuvial/sanssouci。
[9] Blanchard,G.、Neuvial,P.和Roquain,E.(2019年)。补充“使用参考族对误报的事后置信界限”https://doi.org/10.1214/19-AOS1847SUPP。
[10] Bühlmann,P.和Mandozzi,J.(2014)。高维变量筛选和后续推断中的偏差,并进行实证比较。计算。统计师。29 407-430. ·Zbl 1306.65035号 ·doi:10.1007/s00180-013-0436-3
[11] Dezeure,R.、Bühlmann,P.、Meier,L.和Meinshausen,N.(2015)。高维推断:置信区间、(p\)-值和(\mathtt{R}\)-软件\({\mathtt{hdi}}\)。统计师。科学。30 533-558. ·Zbl 1426.62183号 ·doi:10.1214/15-STS527
[12] Donoho,D.和Jin,J.(2004)。对检测稀疏非均匀混合物的批评更高。安。统计师。32 962-994·Zbl 1092.62051号 ·doi:10.1214/009053604000000265
[13] Dudoit,S.和van der Laan,M.J.(2008)。基因组学应用的多重测试程序。统计学中的斯普林格系列。纽约州施普林格·Zbl 1261.62014年
[14] Durand,G.、Blanchard,G.,Neuvial,P.和Roquain,E.(2018年)。空间结构假设的事后假阳性控制。预印。arXiv:1807.01470提供。
[15] Fan,J.、Han,X.和Gu,W.(2012)。估计任意协方差依赖下的错误发现比例。J.Amer。统计师。协会107 1019-1035·Zbl 1395.62219号 ·doi:10.1080/01621459.2012.720478
[16] Fithian,W.、Sun,D.和Taylor,J.(2014)。模型选择后的最佳推断。预印本。可从arXiv:1410.2597获得。
[17] Genovese,C.和Wasserman,L.(2004)。错误发现控制的随机过程方法。安。统计师。32 1035-1061. ·Zbl 1092.62065号 ·doi:10.1214/009053604000000283
[18] Genovese,C.R.和Wasserman,L.(2006)。超过对虚假发现比例的控制。J.Amer。统计师。协会101 1408-1417·Zbl 1171.62338号 ·doi:10.1198/016214500000339
[19] Goeman,J.J.和Solari,A.(2011年)。探索性研究的多重测试。统计师。科学。26 584-597. ·Zbl 1331.62369号 ·doi:10.1214/11-STS356
[20] Hemerik,J.和Goeman,J.J.(2018)。通过排列估计错误发现比例:微阵列显著性分析的置信度。J.R.Stat.Soc.系列。B.统计方法。80 137-155. ·Zbl 1380.62232号 ·doi:10.1111/rssb.12238
[21] Hemerik,J.、Solari,A.和Goeman,J.(2019年)。错误发现比例的基于排列的同时置信限。生物特征。出现·Zbl 1464.62276号
[22] Katsevich,E.和Ramdas,A.(2018年)。走向“同时选择性推理”:错误发现比例的事后界限。预印。arXiv:1803.06790提供。
[23] Lee,J.D.、Sun,D.L.、Sun,Y.和Taylor,J.E.(2016)。精确的后选择推理,并应用于套索。安。统计师。44 907-927·Zbl 1341.62061号 ·doi:10.1214/15-AOS1371
[24] 李伟(2012)。用mrna微阵列分析差异表达的火山图。生物信息学和计算生物学杂志10 1231003。
[25] Meinshausen,N.(2006年)。一般依赖下多个关联测试的错误发现控制。扫描。《美国联邦法律大全》第33卷第227-237页·Zbl 1125.62077号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00488.x
[26] Meinshausen,N.和Bühlmann,P.(2005)。一般依赖结构下多重关联测试的假零假设数的下限。Biometrika 92 893-907·Zbl 1151.62308号 ·doi:10.1093/biomet/92.4.893
[27] R核心团队(2017)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[28] Romano,J.P.和Wolf,M.(2005)。多假设检验的精确和近似逐步下降法。J.Amer。统计师。协会100 94-108·Zbl 1117.62416号 ·doi:10.1198/016214500000539
[29] Simes,R.J.(1986)。一种改进的Bonferroni程序,用于多项显著性测试。生物特征73 751-754·Zbl 0613.62067号 ·doi:10.1093/biomet/73.751
[30] Taylor,J.和Tibshirani,R.J.(2015)。统计学习和选择性推理。程序。国家。阿卡德。科学。美国112 7629-7634·Zbl 1359.62228号 ·doi:10.1073/pnas.1507583112
[31] van der Laan,M.J.、Dudoit,S.和Pollard,K.S.(2004)。控制广义家族错误率和假阳性比例的尾部概率的增强程序。Stat.应用。遗传学。分子生物学。3第15、27条·Zbl 1166.62379号
[32] Westfall,P.H.和Young,S.S.(1993年)。基于重采样的多重测试。\(P\)-值调整的示例和方法。威利·Zbl 0850.62368号
[33] C·吴。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。