阿莱西奥·法科梅尼 现代多重假设检验综述,特别关注错误发现比例。 (英语) Zbl 1156.62048号 统计方法医学研究。 17,第4期,347-388(2008). 摘要:在过去十年中,由于医学、生物信息学、基因组学、脑成像等领域的各种应用,越来越多的统计研究致力于多项测试。即使测试数量非常大,这一领域的研究也侧重于开发强大的程序。本文试图回顾现代多重假设检验的研究,特别关注错误发现比例,这个比例大致定义为错误拒绝数除以拒绝数。我们回顾了主要思想、步骤和增强程序;以及基于重采样的测试。我们还讨论了测试统计数据之间的依赖性问题。通过仿真将这些程序与贝叶斯方法进行了比较。我们说明了DNA微阵列数据分析应用中的程序。最后,强调了进一步研究的可能性。 引用于23文件 MSC公司: 62J15型 配对和多重比较;多次测试 62F03型 参数假设检验 62页第10页 统计学在生物学和医学中的应用;元分析 2015年1月62日 贝叶斯推断 关键词:桌子;DNA微阵列数据分析 软件:R(右) PDF格式BibTeX公司 XML格式引用 \textit{A.Farcomeni},《统计方法医学研究》17,第4号,347--388(2008;Zbl 1156.62048) 全文: 内政部 参考文献: [1] Worsley KJ,《人脑绘图4》,第58页–(1996)·doi:10.1002/(SICI)1097-0193(1996)4:1<58::AID-HBM4>3.0.CO;2个 [2] Ellis SP,《精神病研究》-Neurim 9,第111页–(2000年)·doi:10.1016/S0925-4927(00)00051-2 [3] Merriam EP,Neuron 39,第361页–(2003年)·doi:10.1016/S0896-6273(03)00393-3 [4] Logan BR,《神经影像》22,第95页–(2004)·doi:10.1016/j.neuroimage.2003.12.047 [5] Drigalenko EI,《遗传学流行病学》,第14页,779页–(1997年)·doi:10.1002/(SICI)1098-2272(1997)14:6<779::AID-GEPI36>3.0.CO;2升 [6] Weller JI,遗传学150(4)pp 1699–(1998) [7] Heyen DW,《生理基因组学》1(3),第165页–(1999) [8] Bovenhuis H.,《乳制品科学杂志》83(1)第173页–(2000)·doi:10.3168/jds。S0022-0302(00)74868-5 [9] Mosig MO,Genetics 157 pp 1683–(2001) [10] Reiner A.,生物信息学19,第368页–(2003)·doi:10.1093/bioinformatics/btf877 [11] Dudoit S.,《统计科学》,第18页,第71页–(2003年)·兹比尔1048.62099 ·数字对象标识代码:10.1214/ss/1056397487 [12] Sebastiani P.,《统计科学》,第18页,第33页–(2003年)·Zbl 1048.62108号 ·doi:10.1214/ss/1056397486 [13] Khatri P.,《胸外科年鉴》71(1)第110页–(2001)·doi:10.1016/S0003-4975(00)02350-X [14] Schlaeppi M.,《英国临床实践杂志》50第14页–(1996) [15] Ottenbacher KJ,《美国流行病学杂志》147 pp 615–(1998)·doi:10.1093/oxfordjournals.aje.a009501 [16] 加拿大公交车司机Vedantham K。加拿大精神病学杂志46(2)第149页–(2001) [17] Schaffer CM,《市场研究社会学杂志》40,第155页–(1998) [18] George EI,《美国统计协会杂志》95(452),第1304页–(2000)·doi:10.1080/01621459.2000.10474336 [19] George EI,Biometrika 87(4)第731页–(2000)·Zbl 1029.62008号 ·doi:10.1093/biomet/87.4.731 [20] 叶爱华,《心理测量学》66(1),第109页–(2001)·Zbl 1293.62246号 ·doi:10.1007/BF02295736 [21] Green SB,多变量行为研究32,第39页–(1997)·doi:10.1207/s15327906mbr3201_2 [22] Yekutieli D.,Neerlandica统计局60,第414页–(2006年)·Zbl 1108.62123号 ·文件编号:10.1111/j.1467-9574.2006.00343.x [23] Abramovich F.,《计算统计与数据分析》22,第351页–(1996年)·数字标识代码:10.1016/0167-9473(96)00003-5 [24] Abramovich F.,《统计年鉴》34,第584页–(2006年)·Zbl 1092.62005年 ·doi:10.1214/00905360000000074 [25] Holm S.,《斯堪的纳维亚统计杂志》,第6页,第65页–(1979年) [26] Westfall PH、Kropf S.、Finos L.高维情况下的加权FWE控制方法。在Benjamini Y、Bretz F、Sarkar S编辑的多个比较程序的最新发展。第47卷。数理统计研究所讲稿——专题丛书,2004:143-54·Zbl 1268.62082号 ·doi:10.1214/lnms/1196285632 [27] Benjamini Y.,《皇家统计学会杂志》57页289–(1995) [28] Seeger P.,《技术计量学》,第10页,586页–(1968年)·doi:10.1080/00401706.1968.10490605 [29] van der Laan MJ,统计学在遗传学和分子生物学中的应用3(1)(2004) [30] Genovese CR,《美国统计协会杂志》101第1408页–(2006)·Zbl 1171.62338号 ·doi:10.1198/016214500000339 [31] Efron B.,《遗传学流行病学》,第23页,第70页–(2002年)·doi:10.1002/gepi.1124 [32] Storey JD,《皇家统计学会杂志》,第64页,479页–(2002年)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346 [33] Lehmann EL,《统计年鉴》,第33页,第1138页–(2005年)·Zbl 1072.62060号 ·doi:10.1214/009053605000000084 [34] Sarkar SK,控制广义FWER和广义FDR的Stepup程序(2005)·Zbl 1129.62066号 [35] Storey JD,《统计年鉴》,第31页,2013–(2003)·兹比尔1042.62026 ·doi:10.1214/aos/1074290335 [36] Benjamini Y.,《斯堪的纳维亚统计杂志》24,第407页–(1997)·Zbl 1090.62548号 ·数字对象标识代码:10.1111/1467-9469.00072 [37] Genovese CR,Biometrika 93 pp 509–(2006)·Zbl 1108.62070号 ·doi:10.1093/biomet/93.3509 [38] Genovese CR,《皇家统计学会杂志》,第64页,499页–(2002年)·Zbl 1090.62072号 ·doi:10.1111/1467-9868.00347 [39] Sarkar SK,《统计规划与推断杂志》125,第119页–(2004)·Zbl 1097.62062号 ·doi:10.1016/j.jspi.2003.06.019 [40] Westfall PH,基于重采样的多重测试:p值调整的示例和方法(1993) [41] Miller RG,同步统计推断(1981)·doi:10.1007/978-1-4613-8122-8 [42] Diaconis P.,《数据分析理论:从魔法思维到经典统计》(1985) [43] 联邦调查中Bonferroni程序应用中出现的Ahmed SW问题。1991年,ASA调查研究方法部会议记录,1991年。344-49. [44] Wright SP,《生物统计学》48页1005–(1992)·doi:10.2307/2532694 [45] Dudoit S.,统计学在遗传学和分子生物学中的应用3(1)(2004)·Zbl 1166.62338号 ·doi:10.2202/1544-6115.1040 [46] Hochberg Y.,多重比较程序(1987)·数字对象标识代码:10.1002/9780470316672 [47] Finner H.,《统计年鉴》,第30页,第220页–(2002年)·Zbl 1012.62020年 ·doi:10.1214/aos/1015362191 [48] Pesarin F.,多变量排列测试及其在生物统计学中的应用(2001)·Zbl 0972.62037号 [49] 内政部:10.1007/978-1-4899-4541-9·doi:10.1007/978-1-4899-4541-9 [50] 特伦德尔·K、麦克谢恩。,美国统计学家58 pp 25–(2004)·doi:10.1198/0003130042845 [51] Pollard KS,《统计规划与推断杂志》,第125页,第85页–(2004年)·兹比尔1074.62009 ·doi:10.1016/j.jspi.2003.07.019 [52] Ge Y.,测试12第1页–(2003)·Zbl 1056.62117号 ·doi:10.1007/BF02595811 [53] Farcomeni A.,《斯堪的纳维亚统计杂志》(2006年) [54] Ferreira JA,《统计年鉴》34,第1827页–(2006年)·Zbl 1246.62170号 ·doi:10.1214/009053600000425 [55] Yekutieli D.,《统计规划与推断杂志》82,第171页–(1999)·Zbl 1063.62563号 ·doi:10.1016/S0378-3758(99)00041-5 [56] Meinert CL,临床试验设计、实施和分析(1986年)·doi:10.1093/acprof:oso/9780195035681.0001 [57] Pocock SJ,对照临床试验18,第530页–(1997)·doi:10.1016/S0197-2456(97)00008-1 [58] Chi GYH。,《药物信息杂志》32页1347S–(1998)·doi:10.1177/00928615980320S131 [59] MoyéLA,《流行病学年鉴》8,第351页–(1998年)·doi:10.1016/S1047-2797(98)00003-9 [60] MoyéLA,《医学统计》,第19页,767页–(2000年)·doi:10.1002/(SICI)1097-0258(20000330)19:6<767::AID-SIM518>3.0.CO;2-U型 [61] O'Brien PC,生物计量学40第1079页–(1984年)·doi:10.2307/2531158 [62] Pocock SJ,《生物统计学》第43页,第487页–(1987)·doi:10.2307/2531989 [63] Follmann D.,《医学统计学》,第14页,1163页–(1995年)·doi:10.1002/sim.4780141103 [64] Läuter J.,《生物统计学》,第52页,964页–(1996年)·Zbl 0867.62049号 ·doi:10.2307/2533057 [65] Wei LJ,《美国统计协会杂志》79 pp 653–(1984)·doi:10.1080/01621459.1984.10478093 [66] Wei LJ,《美国统计协会杂志》84 pp 1065–(1989)·doi:10.1080/01621459.1989.10478873 [67] Lehmacher W.,《生物统计学》第47页,第511页–(1991年)·doi:10.2307/2532142 [68] Hochberg Y.,Biometrika 75第800页–(1988年)·Zbl 0661.62067号 ·doi:10.1093/biomet/75.4.800 [69] van der Laan MJ,遗传学和分子生物学中的统计应用3(1)(2004) [70] Sidak Z.,《美国统计协会杂志》62 pp 626–(1967) [71] Sidak Z.,《数理统计年鉴》42第169页–(1971)·Zbl 0218.62063号 ·doi:10.1214/aoms/1177693504 [72] Finner H.,《统计年鉴》26,第505页–(1998年)·Zbl 0934.62073号 ·doi:10.1214/aos/1028144847 [73] Dunnet CW,《美国统计协会杂志》第87页第162页–(1992年)·doi:10.1080/01621459.1992.10475188 [74] Seneta E.,随机过程理论3,第393页–(1997)·Zbl 0932.01037号 [75] Seneta E.,《国际统计评论》73,第21页–(2005年)·Zbl 1296.62124号 ·doi:10.1111/j.1751-5823.005.tb00249.x [76] Shaffer J.,《回顾心理学年鉴》,第46页,561页–(1995年)·doi:10.1146/annurev.ps.46.020195.003021 [77] Simes RJ,Biometrika 73第751页–(1986年)·Zbl 0613.62067号 ·doi:10.1093/biomet/73.3.751 [78] Benjamini Y.,《教育行为统计杂志》,25页,第60页–(2000年)·数字对象标识代码:10.3102/10769986025001060 [79] Benjamini Y.,《统计规划与推断杂志》82,第163页–(1999)·doi:10.1016/S0378-3758(99)00040-3 [80] Storey JD,《皇家统计学会杂志》66页187–(2004)·Zbl 1061.62110号 ·文件编号:10.1111/j.1467-9868.2004.00439.x [81] Genovese CR,《统计年鉴》第32页第1035页–(2004年)·Zbl 1092.62065号 ·doi:10.1214/009053604000000283 [82] Sarkar SK,《统计年鉴》,第30页,第239页–(2002年)·Zbl 1101.62349号 ·doi:10.1214/aos/1015362192 [83] Benjamini Y.,Biometrika 93第491页–(2006年)·Zbl 1108.62069号 ·doi:10.1093/biomet/93.3.491 [84] Tusher VG,PNAS 98第5116页–(2001年)·2014年12月10日 ·doi:10.1073/pnas.091062498 [85] Storey JD,依赖性下的错误发现率,以及DNA微阵列的应用(2001) [86] Schweder T.,Biometrika 69第493页–(1982)·doi:10.1093/biomet/69.3.493 [87] Turkheimer FE,NeuroImage 13第920页–(2001年)·doi:10.1006/nimg.2001.0764 [88] 斯旺佩尔JWH。,《统计年鉴》第27页第24页(1999年)·Zbl 0937.62051号 ·doi:10.1214/aos/1018031099 [89] Meinshausen N.,《统计年鉴》34第373页–(2006年)·Zbl 1091.62059号 ·doi:10.1214/009053605000000741 [90] Langass M.,《皇家统计学会杂志》(Ser B)67,第555页–(2005)·Zbl 1095.62037号 ·数字对象标识代码:10.1111/j.1467-9868.2005.00515.x [91] Miller CJ,《天文学杂志》122第3492页–(2001年)·doi:10.1086/324109 [92] Owen AB,《皇家统计学会杂志》,67 pp 411–(2005)·Zbl 1069.62102号 ·数字对象标识代码:10.1111/j.1467-9868.200500509.x [93] van der Laan MJ,遗传学和分子生物学中的统计应用4(1)(2005)·Zbl 1108.62303号 ·数字对象标识代码:10.2202/1544-6115.1143 [94] R开发核心团队。R.,《统计计算语言和环境》(2004) [95] Perone Pacifico M.,《美国统计协会杂志》99 pp 1002–(2004)·Zbl 1055.62105号 ·doi:10.1198/016214500001655 [96] Green PJ,非参数回归和广义线性模型:粗糙度惩罚方法(1994)·Zbl 0832.62032号 ·doi:10.1007/978-1-4899-4473-3 [97] Berry DA,《统计规划与推断杂志》,第82页,第215页–(1999年)·Zbl 1063.62527号 ·doi:10.1016/S0378-3758(99)00044-0 [98] Berry DA多重比较、多重测试和数据挖掘:贝叶斯观点。在Bernardo J、DeGroot M、Lindley D、Smith A编辑的贝叶斯统计中。第3卷。牛津大学出版社,1988:79-94。 [99] Scott JG,《统计规划与推断杂志》136 pp 2144–(2006)·Zbl 1087.62039号 ·doi:10.1016/j.jspi.2005.08.031 [100] Bayarri MJ,《统计科学》第19页,第58页–(2004年)·Zbl 1062.62001号 ·doi:10.1214/08834230400000116 [101] Duncan DB,Technomerics 7第171页–(1965年)·doi:10.1080/00401706.1965.10490249 [102] Shaffer JP,《统计规划与推断杂志》82页197–(1999)·Zbl 1063.62561号 ·doi:10.1016/S0378-3758(99)00042-7 [103] Leibermann B.,《当代统计问题》(1971年) [104] Finner H.,《统计年鉴》27,第274页–(1999年)·Zbl 0978.62057号 ·doi:10.1214/aos/1018031111 [105] Shaffer JP,《心理学方法》,第7页,第356页–(2002年)·doi:10.1037/1082-989X.7.3.356 [106] Robert CP,蒙特卡洛统计方法(1999)·doi:10.1007/978-1-4757-3071-5 [107] Efron B.,《美国统计协会杂志》96 pp 1151–(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129 [108] Bernardo JM,贝叶斯理论(1994)·doi:10.1002/9780470316870 [109] Kass RE,《美国统计协会杂志》90(431),第928页–(1995)·doi:10.1080/01621459.1995.10476592 [110] Berger JO,《统计科学》12(3),第133页–(1997)·Zbl 0955.62527号 ·doi:10.1214秒/秒1030037904 [111] 杰弗里斯·H·概率论(1961)·Zbl 0116.34904号 [112] Sarkar SK,《统计年鉴》26,第494页–(1998年)·Zbl 0929.62065号 ·doi:10.1214/aos/1028144846 [113] Sarkar SK,《美国统计协会杂志》92 pp 1601–(1997)·doi:10.1080/0162145.1997.10473682 [114] Jogdeo K.,《统计年鉴》5,第495页–(1977年)·Zbl 0401.62028号 ·doi:10.1214/aos/1176343846 [115] van der Laan MJ,《生物统计学》第1页,第1页–(2000年)·Zbl 1110.62337号 ·doi:10.1093/生物统计学/1.1.1 [116] Benjamini Y.,《统计年鉴》29,第1165页–(2001)·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998 [117] Hommel G.,《生物医学杂志》,第25页,第423页–(1983年) [118] Esary JD,《数理统计年鉴》38页1466–(1967)·兹比尔0183.21502 ·doi:10.1214/aoms/1177698701 [119] Farcomeni A.,《统计方法与应用》,第15页,第43页–(2006年)·Zbl 1187.62130号 ·doi:10.1007/s10260-006-0002-z [120] Bickel DR,关于“强控制、保守点估计和错误发现率的同时保守一致性”:大量测试是否排除了FDR的置信区间?(2004) [121] Storey JD,Tibshirani R.全基因组研究的统计意义。《美国国家科学院院刊》1002003:9440-5·Zbl 1130.62385号 ·doi:10.1073/pnas.1530509100 [122] 纽豪斯KL,JAmCollCard 19 pp 885–(1992) [123] Amaratunga D.,DNA微阵列和蛋白质阵列数据的探索和分析(2004) [124] Parmigiani G.,基因表达数据分析:方法和软件(2003)·Zbl 1012.00021号 ·doi:10.1007/b97411 [125] Brown PO,《自然遗传学》21,第33页–(1999)·doi:10.1038/4462 [126] Duggan D.,《自然遗传学》第21页,第10页–(1999年)·数字对象标识代码:10.1038/4434 [127] Bolsover SR,《从基因到细胞》(1997) [128] Garret RH,边化学原理(2002) [129] Tseng G.,《核酸研究》29,第2549页–(2001年)·doi:10.1093/nar/29.12.2549 [130] Yang YH,Dudoit S.,Luu P.,cDNA微阵列数据的快速TP归一化。SPIE BiOS 2001;2001 [131] Durbin BP,《生物信息学》,第20页,第660页–(2004年)·doi:10.1093/bioinformatics/btg464 [132] Zweiger G.,《基因转导:生物医学科学中的信息、无政府状态和革命》(2001) [133] 考夫曼L.,《在数据中寻找群体》(1990年)·Zbl 1345.62009号 ·doi:10.1002/9780470316801 [134] Alon U.,《美国国家学术科学学报》96页6745–(1999)·doi:10.1073/pnas.96.12.6745 [135] Golub TR,《科学》286 pp 531–(1999)·doi:10.1126/science.286.5439.531 [136] Dudoit S.,《美国统计协会杂志》97 pp 77–(2002)·Zbl 1073.62576号 ·doi:10.1198/016214502753479248 [137] Cover T.,IEEE信息理论学报pp IT–(1967) [138] Schervish M.,美国统计学家,50 pp 203–(1996) [139] Bayarri MJ,《美国统计协会杂志》95第1127页–(2000) [140] Cabras S.,用微阵列数据分析中的频率学家p值控制错误发现率(2004) [141] Müller P.,《美国统计协会杂志》99 pp 990-(2004)·Zbl 1055.62127号 ·doi:10.1198/0162145000001646 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。