×

用于识别同时信号的非参数错误发现率控制。 (英文) Zbl 1435.62159号

本文研究了在错误发现率控制下,在多个实验中识别非空特征的问题。提出了一种非参数假发现率控制方法,该方法可以在不知道零分布的情况下识别此类同步信号。理论和仿真结果表明,该方法可以渐近控制错误发现率。它还用于鉴定暴露于同种入侵物的小鼠大脑中差异表达和接近差异可获得染色质的基因。该方法在R包中可用。

MSC公司:

62G10型 非参数假设检验
62页第10页 统计学在生物学和医学中的应用;元分析
62J15型 配对和多重比较;多次测试
92D10型 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andreassen,O.A.、Thompson,W.K.、Schork,A.J.、Ripke,S.、Mattingsdal,M.、Kelsoe,J.R.、Kendler,K.S.、O’Donovan,M.C.、Rujescu,D.、Werge,T.、Sklar,P.、Disorder、T.P.G.P.B.、Groups,S.W.、Roddey,J.C.、Chen,C.-H.、McEvoy,L.、Desikan,R.、Djurovic,S.和Dale,A.M.(2013)。使用多效性信息条件假发现率改进精神分裂症和双相情感障碍常见变异的检测。,《公共科学图书馆·遗传学》9 e1003455。
[2] Arias-Castro,E.和Chen,S.(2017年)。无分布多重测试。,电子统计杂志11 1983-2001·Zbl 1361.62023号 ·doi:10.1214/17-EJS1277
[3] Barber,R.F.和Candès,E.J.(2015)。通过仿冒品控制错误发现率。,统计年鉴43 2055-2085·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[4] Barber,R.F.和Candes,E.J.(2016)。用于高维选择性推理的仿冒过滤器。,arXiv预打印arXiv:1602.03574·Zbl 1444.62034号 ·doi:10.1214/18-AOS1755
[5] Barber,R.F.和Ramdas,A.(2017年)。过滤器:分组假设的多层错误发现率控制。,英国皇家统计学会杂志:B辑(统计方法)79 1247-1268·兹比尔1373.62041 ·doi:10.1111/rssb.12218
[6] Benditkis,J.、Heesen,P.和Janssen,A.(2018年)。教室讲座中多次测试的错误发现率。,统计与概率快报134 29-35·Zbl 1383.62189号 ·doi:10.1016/j.spl.2017.09.017
[7] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用而强大的多重测试方法。,英国皇家统计学会杂志:B辑(方法学)57 289-300·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[8] Bogomolov,M.和Heller,R.(2013)。发现从高维初步研究复制到后续研究的结果。,美国统计协会杂志108 1480-1492·Zbl 1283.62217号 ·doi:10.1080/01621459.2013.829002
[9] Bogomolov,M.和Heller,R.(2018年)。评估两项多特征研究结果的可复制性。,生物特征105 505-516·Zbl 1499.62260号 ·doi:10.1093/biomet/asy029
[10] Candes,E.、Fan,Y.、Janson,L.和Lv,J.(2018)。淘金:用于高维受控变量选择的X型仿制品。,英国皇家统计学会杂志:B辑(统计方法)80 551-577·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[11] Chi,Z.(2008)。具有多变量\(p\)-值的错误发现率控制。,电子统计杂志2 368-411·1320.62100兹罗提 ·doi:10.1214/07-EJS147
[12] Chitpin,J.G.、Awdeh,A.和Perkins,T.J.(2018年)。RECAP揭示了ChIP-seq峰值呼叫的真正统计意义。,生物Rxiv 260687。
[13] Chung,D.、Yang,C.、Li,C.、Gelernter,J.和Zhao,H.(2014)。GPA:通过综合多效性和注释来确定GWAS结果优先级的统计方法。,《公共科学图书馆·遗传学》10 e1004787。
[14] Du,L.和Zhang,C.(2014)。单频调制多次测试。,《统计年鉴》42 30-79·兹比尔1297.62217 ·doi:10.1214/14-AOS1222
[15] Dudoit,S.、van der Laan,M.J.和Pollard,K.S.(2004)。多次测试。第一部分:控制一般I类错误率的单步程序。,遗传学和分子生物学中的统计应用3 1-69·Zbl 1166.62338号 ·doi:10.2202/1544-6115.1040
[16] Efron,B.(2004)。大规模同步假设检验:选择一个无效假设。,美国统计协会期刊99 96-104·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[17] Efron,B.(2007)。相关性和大规模同时显著性检验。,美国统计协会杂志102 93-103·Zbl 1284.62340号 ·doi:10.1198/0162145000001211
[18] Efron,B.(2010年a)。,大尺度推理:估计、测试和预测的经验贝叶斯方法1。剑桥大学出版社·Zbl 1277.62016年
[19] Efron,B.(2010年B)。相关的z值和大规模统计估计的准确性。,美国统计协会杂志105 1042-1055·Zbl 1390.62139号 ·doi:10.1198/jasa.2010.tm09129
[20] Genovese,C.和Wasserman,L.(2002年)。错误发现率程序的操作特征和扩展。,英国皇家统计学会杂志:B辑(统计方法)64 499-517·Zbl 1090.62072号 ·doi:10.1111/1467-9868.00347
[21] Giambartolomei,C.、Zhang,W.、Hauberg,M.、Shi,H.、Boocock,J.、Pickrell,J.,Jaffe,A.E.、Pasaniuc,B.和Roussos,P.(2018年)。基于汇总关联统计的多性状颜色化贝叶斯框架。,生物信息学1 8。
[22] Heinz,S.、Benner,C.、Span,N.、Bertolino,E.、Lin,Y.C.、Laslo,P.、Cheng,J.X.、Murre,C.、Singh,H.和Glass,C.K.(2010)。谱系决定转录因子的简单组合是巨噬细胞和B细胞特性所需的主要顺调控元件。,分子细胞38 576-589。
[23] Heller,R.、Bogomolov,M.和Benjamini,Y.(2014)。决定后续研究是否重复了初步大规模组学研究的结果。,国家科学院院刊111 16262-16267。
[24] Heller,R.和Yekutieli,D.(2014)。全基因组关联研究的可复制性分析。,应用统计学年鉴8 481-498·Zbl 1454.62340号 ·doi:10.1214/13-AOAS697
[25] Meirsman,A.C.、Le Merrer,J.、Pellissier,L.P.、Diaz,J.、Clesse,D.、Kieffer,B.L.和Becker,J.A.(2016)。缺乏GPR88的小鼠表现出运动障碍,改善了空间学习,并通过δ阿片类拮抗剂逆转了低焦虑。,生物精神病学79 917-927。
[26] Melo,I.、Drews,E.、Zimmer,A.和Bilkei-Gorzo,A.(2014)。脑啡肽敲除雄性小鼠对慢性轻度应激具有抵抗力。,基因、大脑和行为13 550-558。
[27] 精神病学基因组学联合会跨学科小组(2013a)。根据全基因组单核苷酸多态性估计五种精神疾病之间的遗传关系。,《自然遗传学》45 984-994。
[28] 精神基因组学联合会的交叉障碍小组(2013b)。识别对五种主要精神疾病具有共同影响的风险位点:全基因组分析。,柳叶刀381 1371。
[29] Park,P.J.(2009)。ChIP-seq:成熟技术的优势和挑战。,《自然评论遗传学》10 669。
[30] Phillips,D.和Ghosh,D.(2014)。利用Voronoi图检验析取假说及其在遗传学中的应用。,应用统计学年鉴8 801-823·兹比尔1454.62376 ·doi:10.1214/13-AOAS707
[31] Pollard,D.(1990)。经验过程:理论和应用。年,NSF-CBMS概率统计区域会议系列i-86。JSTOR公司。
[32] Ramdas,A.、Barber,R.F.、Wainwright,M.J.和Jordan,M.I.(2019年)。使用(p\)-过滤器对具有先验知识的多重测试进行统一处理。,统计年鉴。出现·Zbl 1433.62204号 ·doi:10.1214/18-AOS1765
[33] Rittschof,C.C.、Bukhari,S.A.、Sloofman,L.G.、Troy,J.M.、Caetano-AnolléS,D.、Cash-Ahmed,A.、Kent,M.、Lu,X.、Sanogo,Y.O.、Weisner,P.A.、Zhang,H.、Bell,A.M.、Ma,J.、Sinha,S.、Robinson,G.E.和Stubbs,L.(2014)。神经分子对社会挑战的反应:小鼠、棘背鱼和蜜蜂的共同机制。,国家科学院院刊111 17929-17934。
[34] Robinson,G.E.、Grozinger,C.M.和Whitfield,C.W.(2005)。社会基因组学:分子意义上的社会生活。,《自然评论遗传学》6 257。
[35] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。edgeR:用于数字基因表达数据差异表达分析的Bioconductor软件包。,生物信息学26 139-140。
[36] Romano,J.P.和Wolf,M.(2007年)。多重测试中广义错误率的控制。,统计年鉴35 1378-1408·Zbl 1127.62063号 ·doi:10.1214/009053600000001622
[37] Sarkar,S.K.(2008)。关于控制错误发现率的方法。,Sankhyá:《印度统计杂志》,A辑(2008-)135-168·Zbl 1193.62121号
[38] Saul,M.、Seward,C.H.、Troy,J.M.、Zhang,H.、Sloofman,L.G.、Lu,X.、Weisner,P.A.、Caetano Anoles,D.、Sun,H.、Zhao,S.D.、Chandrasekaran,S.、Sinha,S.和Stubbs,L.(2017)。转录调控动力学驱动小鼠对社会挑战的协调代谢和神经反应。,基因组研究gr-214221。
[39] Saul,M.C.、Blatti,C.、Yang,W.、Bukhari,S.A.、Shpigler,H.Y.、Troy,J.M.、Seward,C.H.、Sloofman,L.、Chandrasekaran,S.、Bell,A.M.、Stubbs,L.,Robinson,G.E.、Zhao,S.D.和Sinha,S.(2018)。神经基因组应对社会挑战进化工具包的跨谱系统分析。,基因、大脑和行为e12502。
[40] Schwartzman,A.(2008)。指数族的经验零发现率和错误发现率推断。,应用统计学年鉴2 1332-1359·兹比尔1158.62047 ·doi:10.1214/08-AOAS184
[41] Schwartzman,A.(2012)。评论:FDP与FDR以及条件反射的影响。,美国统计协会杂志107 1039-1041·Zbl 1395.62223号 ·doi:10.1080/01621459.2012.712876
[42] Shen,L.,Shao,N.Y.,Liu,X.,Maze,I.,Feng,J.和Nestler,E.J.(2013)。diffReps:利用生物复制品从ChIP-seq数据中检测差异染色质修饰位点。,公共图书馆One 8 e65598。
[43] Shi,L.等人(2010)。微阵列质量控制(MAQC)-II基于微阵列预测模型开发和验证的通用实践研究。,自然生物技术28 827。
[44] Storey,J.D.(2002)。错误发现率的直接方法。,英国皇家统计学会杂志:B辑(统计方法)64 479-498·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[45] Storey,J.D.、Taylor,J.E.和Siegmund,D.(2004)。强控制、保守点估计和错误发现率的同时保守一致性:统一方法。,英国皇家统计学会杂志:B辑(统计方法)66 187-205·Zbl 1061.62110号 ·文件编号:10.1111/j.1467-9868.2004.00439.x
[46] Sun,W.和Cai,T.T.(2007)。Oracle和用于错误发现率控制的自适应复合决策规则。,美国统计协会杂志102 901-912·Zbl 1469.62318号 ·doi:10.1198/0162145000000545
[47] Thompson,D.、Regev,A.和Roy,S.(2015)。基因调控网络的比较分析:从网络重建到进化。,细胞与发育生物学年鉴31 399-428。
[48] Wallace,C.、Rotival,M.、Cooper,J.D.、Rice,C.M.、Yang,J.H.、McNeill,M、Smyth,D.J.、Niblett,D.、Cambien,F.、Consortium,C.、Tiret,L.、Todd,J.A.、Clayton,D.G.和Blankenberg,S.(2012)。1型糖尿病单核细胞基因表达和遗传风险变体的统计共定位。,人类分子遗传学21 2815-2824。
[49] Westfall,P.H.,Young,S.S.等人(1993)。,基于重采样的多重测试:p值调整的示例和方法279。约翰·威利父子公司。
[50] Wu,M.C.、Lee,S.、Cai,T.、Li,Y.、Boehnke,M.和Lin,X.(2011)。基于序列核关联检验的测序数据Rare-variant关联检验。,美国人类遗传学杂志89 82-93。
[51] Xiang,D.,Zhao,S.D.和Cai,T.T.(2019)。大规模多次试验多序列综合分析的信号分类。,英国皇家统计学会杂志:B辑(统计方法)。出现·Zbl 1428.62300号 ·doi:10.1111/rssb.12323
[52] Yekutieli,D.和Benjamini,Y.(1999)。基于重采样的错误发现率控制相关测试统计的多个测试过程。,统计规划与推断杂志82 171-196·Zbl 1063.62563号 ·doi:10.1016/S0378-3758(99)00041-5
[53] Yu,D.、Huber,W.和Vitek,O.(2013)。小样本RNA-seq实验负二项模型中离散度的收缩估计。,生物信息学29 1275-1282。
[54] Zhang,Y.,Liu,T.,Meyer,C.A.,Eeckhoute,J.,Johnson,D.S.,Bernstein,B.E.,Nusbaum,C.,Myers,R.M.,Brown,M.,Li,W.和Liu,X.S.(2008)。基于模型的ChIP-Seq分析(MACS)。,基因组生物学9 R137。
[55] Zhao,S.D.、Cai,T.T.和Li,H.(2017)。两个多重测试序列间弱正潜在相关性的最优检测。,多元分析杂志160 169-184·Zbl 1397.62266号 ·doi:10.1016/j.jmva.2017.06.009
[56] 赵,S。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。