×

GAP:两样本稀疏推理中信息池的通用框架。 (英语) Zbl 1441.62195号

摘要:本文开发了一个通用框架,用于利用两样本多测试问题中的稀疏信息。我们建议首先构造一个协变量序列,以捕获稀疏性结构,然后通过分组、调整和池(GAP)三步算法将辅助协变量纳入推理。GAP程序为信息池提供了一个简单有效的框架。GAP的一个重要优点是它能够处理各种依赖结构,例如高维线性回归、微分相关分析和微分网络分析产生的依赖结构。我们建立了GAP对错误发现率控制渐近有效的一般条件,并表明这些条件在一系列设置中都得到了满足,包括测试多元正态均值、高维线性回归、微分协方差或相关矩阵以及高斯图形模型。数值结果表明,该框架可以显著改进现有的方法。GAP程序通过一项乳腺癌研究来验证基因-基因相互作用。

MSC公司:

62J15型 配对和多重比较;多重测试

软件:

HdBCS公司;DNA
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴苏,P。;T.Cai,T。;Das,K。;Sun,W.,“大规模多重测试中的加权错误发现率控制”,《美国统计协会杂志》,即将出版(2017年)
[2] Y.本杰米尼。;Hochberg,Y.,“控制错误发现率:一种实用而有力的多重测试方法”,《皇家统计学会杂志》,B辑,57,289-300(1995)·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[3] Y.本杰米尼。;Yekutieli,D.,Under Dependency”,“多重测试中错误发现率的控制”,《统计年鉴》,1165-1188(2001)·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[4] Cai,T.T。;Jin,J.,“在大规模多重测试中估计零密度和非零效应比例的最佳收敛速度”,《统计年鉴》,38,100-145(2010)·Zbl 1181.62040号 ·doi:10.1214/09-AOS696
[5] Cai,T.T。;刘伟,“相关性的大尺度多重检验”,《美国统计协会杂志》,111229-240(2016)·doi:10.1080/01621459.2014.999157
[6] Cai,T.T。;刘伟。;Xia,Y.,“高维稀疏环境下的双样本协方差矩阵检验与支持恢复”,美国统计协会杂志,108,265-277(2013)·兹伯利06158341 ·doi:10.1080/01621459.2012.758041
[7] Cai,T.T。;Sun,W.,“分组假设的同步测试:在多个干草堆中发现针头”,《美国统计协会杂志》,1041467-1481(2009)·Zbl 1205.62005号 ·doi:10.1198/jasa.2009.tm08415
[8] Cai,T.T。;Sun,W。;Wang,W.,大尺度双样本推断的协变量辅助排序和筛选(讨论),”,《皇家统计学会杂志》,B辑,81,187-234(2019)·Zbl 1420.62032号 ·doi:10.1111/rssb.12304
[9] 坎迪斯,E。;Tao,T.,“Dantzig选择器:当p远大于n时的统计估计”,《统计年鉴》,35,2313-2351(2007)·Zbl 1139.62019号 ·doi:10.1214/09053606000001523
[10] Caspi,A。;Moffitt,T.E.,“精神病学中的基因-环境相互作用:与神经科学的合力”,《自然评论神经科学》,7583-590(2006)·doi:10.1038/nrn1925
[11] 多布拉,A。;汉斯,C。;琼斯,B。;内文斯,J.R。;姚,G。;West,M.,“探索基因表达数据的稀疏图形模型”,《多元分析杂志》,90,196-212(2004)·Zbl 1047.62104号 ·doi:10.1016/j.jmva.2004.02.009
[12] 杜,L。;Zhang,C.,“单因次调制多重测试”,《统计年鉴》,421262-1311(2014)·Zbl 1297.62217号 ·doi:10.1214/14-AOS1222
[13] Efron,B.,“相关性和大尺度同时显著性检验”,《美国统计协会杂志》,102,93-103(2007)·Zbl 1284.62340号 ·doi:10.1198/0162145000001211
[14] Efron,B.,“同步推断:假设检验问题何时应合并?”,《应用统计学年鉴》,2197-223(2008)·兹比尔1137.62010 ·doi:10.1214/07-AOAS141
[15] 费尔金斯塔德,E。;弗里格西,A。;H街。;Thorleifsson,G。;Kong,A.,“具有外部协变量的非监督经验贝叶斯多重检验”,《应用统计年鉴》,2714-735(2008)·Zbl 1400.62258号 ·doi:10.1214/08-AOAS158
[16] Genovese,C.R。;罗德,K。;Wasserman,L.,“利用p值加权的错误发现控制”,《生物特征》,93,509-524(2006)·Zbl 1108.62070号 ·doi:10.1093/biomet/93.3509
[17] 吉尔·R。;达塔,S。;Datta,S.,“微阵列数据差异网络分析的统计框架”,BMC生物信息学,11,1,95-10(2010)·doi:10.1186/1471-2105-11-95
[18] 胡建新。;赵,H。;周浩浩,“利用群体控制错误发现率”,《美国统计协会杂志》,第105期,第1215-1227页(2012年)·Zbl 1390.62143号 ·doi:10.1198/jasa.2010.tm09329
[19] Hunter,D.J.,“人类疾病中的基因-环境相互作用”,《自然评论遗传学》,68287-298(2005)·doi:10.1038/nrg1578
[20] Jin,J。;Cai,T.T.,“在大规模多重比较中估计零效应和非零效应的比例”,《美国统计协会杂志》,102495-506(2007)·Zbl 1172.62319号 ·doi:10.1198/0162145000000167
[21] Langaas,M。;Lindqvist,B.H。;Ferkingstad,E.,“利用DNA微阵列数据估算真零假设的比例”,《皇家统计学会杂志》,B辑,67,555-572(2005)·Zbl 1095.62037号 ·数字对象标识代码:10.1111/j.1467-9868.2005.00515.x
[22] Liu,W.,“带假发现率控制的高斯图形模型估计”,《统计年鉴》,412948-2978(2013)·Zbl 1288.62094号 ·doi:10.1214/13-AOS1169
[23] Liu,W.,“将稀疏信息纳入大规模多重双样本t检验”,arXiv预印本arXiv,1410,4282(2014)
[24] 刘伟。;Luo,S.,技术报告,“高维回归模型的假设检验”(2014),上海交通大学
[25] Marchini,J。;唐纳利,P。;Cardon,L.,“检测影响复杂疾病的多基因座的全基因组策略”,《自然遗传学》,37,413-417(2005)·doi:10.1038/ng1537
[26] 明绍森,N。;Rice,J.,“在大量独立测试的假设中估计假零假设的比例”,《统计年鉴》,34,373-393(2006)·兹比尔1091.62059 ·doi:10.1214/09053605000000741
[27] Nathanson,K。;伍斯特,R。;韦伯,B.,“乳腺癌遗传学:我们知道什么和我们需要什么”,《自然医学》,7552-556(2001)·doi:10.1038/87876
[28] Olopade,O。;Grushko,T。;南达·R。;霍博士,“乳腺癌的进展:个性化医学的途径”,《临床癌症研究》,第147988页(2008年)·doi:10.1158/1078-0432.CCR-08-1211
[29] Sarkar,S.K.,《程序》,《统计年鉴》,第30期,第239-257页(2002年)·Zbl 1101.62349号
[30] 施维德,T。;Spjötvoll,E.,“同时评估多项测试的p值图”,《生物统计学》,69,493-502(1982)·doi:10.1093/biomet/69.3.493
[31] 斯科特·J·G。;凯利·R·C。;医学硕士史密斯。;周,P。;Kass,R.E.,“错误发现率回归:在初级视觉皮层神经同步检测中的应用”,美国协会统计杂志,110,459-471(2015)·doi:10.1080/01621459.2014.990973
[32] 西格尔,E。;夏皮拉,M。;雷格夫,A。;佩尔,D。;博茨坦,D。;科勒,D。;Friedman,N.,“模块网络:从基因表达数据中识别调节模块及其条件特异性调节器”,《自然遗传学》,34,166-176(2003)·doi:10.1038/ng1165
[33] Storey,J.D.,“错误发现率的直接方法”,《期刊》。皇家统计学会,B辑,64,479-498(2002)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[34] Storey,J.D。;肖伟(Xiao,W.)。;Leek,J.T。;汤普金斯,R.G。;Davis,R.W.,“时间进程微阵列实验的显著性分析”,美国国家科学院学报,10212837-12842(2005)·doi:10.1073/pnas.0504609102
[35] Sun,W。;Cai,T.T.,“依赖下的大规模多重测试”,《皇家统计学会杂志》,B辑,71,393-424(2009)·Zbl 1248.62005号 ·doi:10.1111/j.1467-9868.2008.00694.x
[36] Sun,W。;Wei,Z.,《模式识别的多重测试及其在时序微阵列实验中的应用》,《美国统计协会杂志》,106,73-88(2011)·Zbl 1396.62261号 ·doi:10.1198/jasa.2011.ap09587
[37] Tai,Y.C。;Speed,T.P.,“重复微阵列时间历程数据的多元经验贝叶斯统计”,《统计年鉴》,34,2387-2412(2006)·Zbl 1106.62008号 ·doi:10.1214/09053606000000759
[38] 夏,Y。;蔡,T。;Cai,T.T.,“测试差异网络及其在基因-基因相互作用检测中的应用”,Biometrika,102247-266(2015)·Zbl 1452.62392号 ·doi:10.1093/biomet/asu074
[39] 夏,Y。;蔡,T。;Cai,T.T.,“高维线性回归的两样本检验及其在检测交互作用中的应用”,《统计中国》,28,63-92(2018)·Zbl 1382.62042号
[40] Zerba,K。;费雷尔,R。;Sing,C.,“复杂适应系统与人类健康:载脂蛋白E(ApoE)基因多态性的常见基因型和年龄对脂质代谢特征领域内相关顺序的影响”,《人类遗传学》,107,466-475(2000)·数字标识代码:10.1007/s004390000394
[41] 张,C.-H。;黄静,“高维线性回归中拉索选择的稀疏性和偏差”,《统计年鉴》,第36期,第1567-1594页(2008)·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。