×

现代多重假设检验综述,特别关注错误发现比例。 (英语) Zbl 1156.62048号

摘要:在过去十年中,由于医学、生物信息学、基因组学、脑成像等领域的各种应用,越来越多的统计研究致力于多项测试。即使测试数量非常大,这一领域的研究也侧重于开发强大的程序。本文试图回顾现代多重假设检验的研究,特别关注错误发现比例,这个比例大致定义为错误拒绝数除以拒绝数。我们回顾了主要思想、步骤和增强程序;以及基于重采样的测试。我们还讨论了测试统计数据之间的依赖性问题。通过仿真将这些程序与贝叶斯方法进行了比较。我们说明了DNA微阵列数据分析应用中的程序。最后,强调了进一步研究的可能性。

MSC公司:

62J15型 配对和多重比较;多次测试
62F03型 参数假设检验
62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断

软件:

R(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Worsley KJ,《人脑绘图4》,第58页–(1996)·doi:10.1002/(SICI)1097-0193(1996)4:1<58::AID-HBM4>3.0.CO;2个
[2] Ellis SP,《精神病研究》-Neurim 9,第111页–(2000年)·doi:10.1016/S0925-4927(00)00051-2
[3] Merriam EP,Neuron 39,第361页–(2003年)·doi:10.1016/S0896-6273(03)00393-3
[4] Logan BR,《神经影像》22,第95页–(2004)·doi:10.1016/j.neuroimage.2003.12.047
[5] Drigalenko EI,《遗传学流行病学》,第14页,779页–(1997年)·doi:10.1002/(SICI)1098-2272(1997)14:6<779::AID-GEPI36>3.0.CO;2升
[6] Weller JI,遗传学150(4)pp 1699–(1998)
[7] Heyen DW,《生理基因组学》1(3),第165页–(1999)
[8] Bovenhuis H.,《乳制品科学杂志》83(1)第173页–(2000)·doi:10.3168/jds。S0022-0302(00)74868-5
[9] Mosig MO,Genetics 157 pp 1683–(2001)
[10] Reiner A.,生物信息学19,第368页–(2003)·doi:10.1093/bioinformatics/btf877
[11] Dudoit S.,《统计科学》,第18页,第71页–(2003年)·兹比尔1048.62099 ·数字对象标识代码:10.1214/ss/1056397487
[12] Sebastiani P.,《统计科学》,第18页,第33页–(2003年)·Zbl 1048.62108号 ·doi:10.1214/ss/1056397486
[13] Khatri P.,《胸外科年鉴》71(1)第110页–(2001)·doi:10.1016/S0003-4975(00)02350-X
[14] Schlaeppi M.,《英国临床实践杂志》50第14页–(1996)
[15] Ottenbacher KJ,《美国流行病学杂志》147 pp 615–(1998)·doi:10.1093/oxfordjournals.aje.a009501
[16] 加拿大公交车司机Vedantham K。加拿大精神病学杂志46(2)第149页–(2001)
[17] Schaffer CM,《市场研究社会学杂志》40,第155页–(1998)
[18] George EI,《美国统计协会杂志》95(452),第1304页–(2000)·doi:10.1080/01621459.2000.10474336
[19] George EI,Biometrika 87(4)第731页–(2000)·Zbl 1029.62008号 ·doi:10.1093/biomet/87.4.731
[20] 叶爱华,《心理测量学》66(1),第109页–(2001)·Zbl 1293.62246号 ·doi:10.1007/BF02295736
[21] Green SB,多变量行为研究32,第39页–(1997)·doi:10.1207/s15327906mbr3201_2
[22] Yekutieli D.,Neerlandica统计局60,第414页–(2006年)·Zbl 1108.62123号 ·文件编号:10.1111/j.1467-9574.2006.00343.x
[23] Abramovich F.,《计算统计与数据分析》22,第351页–(1996年)·数字标识代码:10.1016/0167-9473(96)00003-5
[24] Abramovich F.,《统计年鉴》34,第584页–(2006年)·Zbl 1092.62005年 ·doi:10.1214/00905360000000074
[25] Holm S.,《斯堪的纳维亚统计杂志》,第6页,第65页–(1979年)
[26] Westfall PH、Kropf S.、Finos L.高维情况下的加权FWE控制方法。在Benjamini Y、Bretz F、Sarkar S编辑的多个比较程序的最新发展。第47卷。数理统计研究所讲稿——专题丛书,2004:143-54·Zbl 1268.62082号 ·doi:10.1214/lnms/1196285632
[27] Benjamini Y.,《皇家统计学会杂志》57页289–(1995)
[28] Seeger P.,《技术计量学》,第10页,586页–(1968年)·doi:10.1080/00401706.1968.10490605
[29] van der Laan MJ,统计学在遗传学和分子生物学中的应用3(1)(2004)
[30] Genovese CR,《美国统计协会杂志》101第1408页–(2006)·Zbl 1171.62338号 ·doi:10.1198/016214500000339
[31] Efron B.,《遗传学流行病学》,第23页,第70页–(2002年)·doi:10.1002/gepi.1124
[32] Storey JD,《皇家统计学会杂志》,第64页,479页–(2002年)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[33] Lehmann EL,《统计年鉴》,第33页,第1138页–(2005年)·Zbl 1072.62060号 ·doi:10.1214/009053605000000084
[34] Sarkar SK,控制广义FWER和广义FDR的Stepup程序(2005)·Zbl 1129.62066号
[35] Storey JD,《统计年鉴》,第31页,2013–(2003)·兹比尔1042.62026 ·doi:10.1214/aos/1074290335
[36] Benjamini Y.,《斯堪的纳维亚统计杂志》24,第407页–(1997)·Zbl 1090.62548号 ·数字对象标识代码:10.1111/1467-9469.00072
[37] Genovese CR,Biometrika 93 pp 509–(2006)·Zbl 1108.62070号 ·doi:10.1093/biomet/93.3509
[38] Genovese CR,《皇家统计学会杂志》,第64页,499页–(2002年)·Zbl 1090.62072号 ·doi:10.1111/1467-9868.00347
[39] Sarkar SK,《统计规划与推断杂志》125,第119页–(2004)·Zbl 1097.62062号 ·doi:10.1016/j.jspi.2003.06.019
[40] Westfall PH,基于重采样的多重测试:p值调整的示例和方法(1993)
[41] Miller RG,同步统计推断(1981)·doi:10.1007/978-1-4613-8122-8
[42] Diaconis P.,《数据分析理论:从魔法思维到经典统计》(1985)
[43] 联邦调查中Bonferroni程序应用中出现的Ahmed SW问题。1991年,ASA调查研究方法部会议记录,1991年。344-49.
[44] Wright SP,《生物统计学》48页1005–(1992)·doi:10.2307/2532694
[45] Dudoit S.,统计学在遗传学和分子生物学中的应用3(1)(2004)·Zbl 1166.62338号 ·doi:10.2202/1544-6115.1040
[46] Hochberg Y.,多重比较程序(1987)·数字对象标识代码:10.1002/9780470316672
[47] Finner H.,《统计年鉴》,第30页,第220页–(2002年)·Zbl 1012.62020年 ·doi:10.1214/aos/1015362191
[48] Pesarin F.,多变量排列测试及其在生物统计学中的应用(2001)·Zbl 0972.62037号
[49] 内政部:10.1007/978-1-4899-4541-9·doi:10.1007/978-1-4899-4541-9
[50] 特伦德尔·K、麦克谢恩。,美国统计学家58 pp 25–(2004)·doi:10.1198/0003130042845
[51] Pollard KS,《统计规划与推断杂志》,第125页,第85页–(2004年)·兹比尔1074.62009 ·doi:10.1016/j.jspi.2003.07.019
[52] Ge Y.,测试12第1页–(2003)·Zbl 1056.62117号 ·doi:10.1007/BF02595811
[53] Farcomeni A.,《斯堪的纳维亚统计杂志》(2006年)
[54] Ferreira JA,《统计年鉴》34,第1827页–(2006年)·Zbl 1246.62170号 ·doi:10.1214/009053600000425
[55] Yekutieli D.,《统计规划与推断杂志》82,第171页–(1999)·Zbl 1063.62563号 ·doi:10.1016/S0378-3758(99)00041-5
[56] Meinert CL,临床试验设计、实施和分析(1986年)·doi:10.1093/acprof:oso/9780195035681.0001
[57] Pocock SJ,对照临床试验18,第530页–(1997)·doi:10.1016/S0197-2456(97)00008-1
[58] Chi GYH。,《药物信息杂志》32页1347S–(1998)·doi:10.1177/00928615980320S131
[59] MoyéLA,《流行病学年鉴》8,第351页–(1998年)·doi:10.1016/S1047-2797(98)00003-9
[60] MoyéLA,《医学统计》,第19页,767页–(2000年)·doi:10.1002/(SICI)1097-0258(20000330)19:6<767::AID-SIM518>3.0.CO;2-U型
[61] O'Brien PC,生物计量学40第1079页–(1984年)·doi:10.2307/2531158
[62] Pocock SJ,《生物统计学》第43页,第487页–(1987)·doi:10.2307/2531989
[63] Follmann D.,《医学统计学》,第14页,1163页–(1995年)·doi:10.1002/sim.4780141103
[64] Läuter J.,《生物统计学》,第52页,964页–(1996年)·Zbl 0867.62049号 ·doi:10.2307/2533057
[65] Wei LJ,《美国统计协会杂志》79 pp 653–(1984)·doi:10.1080/01621459.1984.10478093
[66] Wei LJ,《美国统计协会杂志》84 pp 1065–(1989)·doi:10.1080/01621459.1989.10478873
[67] Lehmacher W.,《生物统计学》第47页,第511页–(1991年)·doi:10.2307/2532142
[68] Hochberg Y.,Biometrika 75第800页–(1988年)·Zbl 0661.62067号 ·doi:10.1093/biomet/75.4.800
[69] van der Laan MJ,遗传学和分子生物学中的统计应用3(1)(2004)
[70] Sidak Z.,《美国统计协会杂志》62 pp 626–(1967)
[71] Sidak Z.,《数理统计年鉴》42第169页–(1971)·Zbl 0218.62063号 ·doi:10.1214/aoms/1177693504
[72] Finner H.,《统计年鉴》26,第505页–(1998年)·Zbl 0934.62073号 ·doi:10.1214/aos/1028144847
[73] Dunnet CW,《美国统计协会杂志》第87页第162页–(1992年)·doi:10.1080/01621459.1992.10475188
[74] Seneta E.,随机过程理论3,第393页–(1997)·Zbl 0932.01037号
[75] Seneta E.,《国际统计评论》73,第21页–(2005年)·Zbl 1296.62124号 ·doi:10.1111/j.1751-5823.005.tb00249.x
[76] Shaffer J.,《回顾心理学年鉴》,第46页,561页–(1995年)·doi:10.1146/annurev.ps.46.020195.003021
[77] Simes RJ,Biometrika 73第751页–(1986年)·Zbl 0613.62067号 ·doi:10.1093/biomet/73.3.751
[78] Benjamini Y.,《教育行为统计杂志》,25页,第60页–(2000年)·数字对象标识代码:10.3102/10769986025001060
[79] Benjamini Y.,《统计规划与推断杂志》82,第163页–(1999)·doi:10.1016/S0378-3758(99)00040-3
[80] Storey JD,《皇家统计学会杂志》66页187–(2004)·Zbl 1061.62110号 ·文件编号:10.1111/j.1467-9868.2004.00439.x
[81] Genovese CR,《统计年鉴》第32页第1035页–(2004年)·Zbl 1092.62065号 ·doi:10.1214/009053604000000283
[82] Sarkar SK,《统计年鉴》,第30页,第239页–(2002年)·Zbl 1101.62349号 ·doi:10.1214/aos/1015362192
[83] Benjamini Y.,Biometrika 93第491页–(2006年)·Zbl 1108.62069号 ·doi:10.1093/biomet/93.3.491
[84] Tusher VG,PNAS 98第5116页–(2001年)·2014年12月10日 ·doi:10.1073/pnas.091062498
[85] Storey JD,依赖性下的错误发现率,以及DNA微阵列的应用(2001)
[86] Schweder T.,Biometrika 69第493页–(1982)·doi:10.1093/biomet/69.3.493
[87] Turkheimer FE,NeuroImage 13第920页–(2001年)·doi:10.1006/nimg.2001.0764
[88] 斯旺佩尔JWH。,《统计年鉴》第27页第24页(1999年)·Zbl 0937.62051号 ·doi:10.1214/aos/1018031099
[89] Meinshausen N.,《统计年鉴》34第373页–(2006年)·Zbl 1091.62059号 ·doi:10.1214/009053605000000741
[90] Langass M.,《皇家统计学会杂志》(Ser B)67,第555页–(2005)·Zbl 1095.62037号 ·数字对象标识代码:10.1111/j.1467-9868.2005.00515.x
[91] Miller CJ,《天文学杂志》122第3492页–(2001年)·doi:10.1086/324109
[92] Owen AB,《皇家统计学会杂志》,67 pp 411–(2005)·Zbl 1069.62102号 ·数字对象标识代码:10.1111/j.1467-9868.200500509.x
[93] van der Laan MJ,遗传学和分子生物学中的统计应用4(1)(2005)·Zbl 1108.62303号 ·数字对象标识代码:10.2202/1544-6115.1143
[94] R开发核心团队。R.,《统计计算语言和环境》(2004)
[95] Perone Pacifico M.,《美国统计协会杂志》99 pp 1002–(2004)·Zbl 1055.62105号 ·doi:10.1198/016214500001655
[96] Green PJ,非参数回归和广义线性模型:粗糙度惩罚方法(1994)·Zbl 0832.62032号 ·doi:10.1007/978-1-4899-4473-3
[97] Berry DA,《统计规划与推断杂志》,第82页,第215页–(1999年)·Zbl 1063.62527号 ·doi:10.1016/S0378-3758(99)00044-0
[98] Berry DA多重比较、多重测试和数据挖掘:贝叶斯观点。在Bernardo J、DeGroot M、Lindley D、Smith A编辑的贝叶斯统计中。第3卷。牛津大学出版社,1988:79-94。
[99] Scott JG,《统计规划与推断杂志》136 pp 2144–(2006)·Zbl 1087.62039号 ·doi:10.1016/j.jspi.2005.08.031
[100] Bayarri MJ,《统计科学》第19页,第58页–(2004年)·Zbl 1062.62001号 ·doi:10.1214/08834230400000116
[101] Duncan DB,Technomerics 7第171页–(1965年)·doi:10.1080/00401706.1965.10490249
[102] Shaffer JP,《统计规划与推断杂志》82页197–(1999)·Zbl 1063.62561号 ·doi:10.1016/S0378-3758(99)00042-7
[103] Leibermann B.,《当代统计问题》(1971年)
[104] Finner H.,《统计年鉴》27,第274页–(1999年)·Zbl 0978.62057号 ·doi:10.1214/aos/1018031111
[105] Shaffer JP,《心理学方法》,第7页,第356页–(2002年)·doi:10.1037/1082-989X.7.3.356
[106] Robert CP,蒙特卡洛统计方法(1999)·doi:10.1007/978-1-4757-3071-5
[107] Efron B.,《美国统计协会杂志》96 pp 1151–(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[108] Bernardo JM,贝叶斯理论(1994)·doi:10.1002/9780470316870
[109] Kass RE,《美国统计协会杂志》90(431),第928页–(1995)·doi:10.1080/01621459.1995.10476592
[110] Berger JO,《统计科学》12(3),第133页–(1997)·Zbl 0955.62527号 ·doi:10.1214秒/秒1030037904
[111] 杰弗里斯·H·概率论(1961)·Zbl 0116.34904号
[112] Sarkar SK,《统计年鉴》26,第494页–(1998年)·Zbl 0929.62065号 ·doi:10.1214/aos/1028144846
[113] Sarkar SK,《美国统计协会杂志》92 pp 1601–(1997)·doi:10.1080/0162145.1997.10473682
[114] Jogdeo K.,《统计年鉴》5,第495页–(1977年)·Zbl 0401.62028号 ·doi:10.1214/aos/1176343846
[115] van der Laan MJ,《生物统计学》第1页,第1页–(2000年)·Zbl 1110.62337号 ·doi:10.1093/生物统计学/1.1.1
[116] Benjamini Y.,《统计年鉴》29,第1165页–(2001)·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[117] Hommel G.,《生物医学杂志》,第25页,第423页–(1983年)
[118] Esary JD,《数理统计年鉴》38页1466–(1967)·兹比尔0183.21502 ·doi:10.1214/aoms/1177698701
[119] Farcomeni A.,《统计方法与应用》,第15页,第43页–(2006年)·Zbl 1187.62130号 ·doi:10.1007/s10260-006-0002-z
[120] Bickel DR,关于“强控制、保守点估计和错误发现率的同时保守一致性”:大量测试是否排除了FDR的置信区间?(2004)
[121] Storey JD,Tibshirani R.全基因组研究的统计意义。《美国国家科学院院刊》1002003:9440-5·Zbl 1130.62385号 ·doi:10.1073/pnas.1530509100
[122] 纽豪斯KL,JAmCollCard 19 pp 885–(1992)
[123] Amaratunga D.,DNA微阵列和蛋白质阵列数据的探索和分析(2004)
[124] Parmigiani G.,基因表达数据分析:方法和软件(2003)·Zbl 1012.00021号 ·doi:10.1007/b97411
[125] Brown PO,《自然遗传学》21,第33页–(1999)·doi:10.1038/4462
[126] Duggan D.,《自然遗传学》第21页,第10页–(1999年)·数字对象标识代码:10.1038/4434
[127] Bolsover SR,《从基因到细胞》(1997)
[128] Garret RH,边化学原理(2002)
[129] Tseng G.,《核酸研究》29,第2549页–(2001年)·doi:10.1093/nar/29.12.2549
[130] Yang YH,Dudoit S.,Luu P.,cDNA微阵列数据的快速TP归一化。SPIE BiOS 2001;2001
[131] Durbin BP,《生物信息学》,第20页,第660页–(2004年)·doi:10.1093/bioinformatics/btg464
[132] Zweiger G.,《基因转导:生物医学科学中的信息、无政府状态和革命》(2001)
[133] 考夫曼L.,《在数据中寻找群体》(1990年)·Zbl 1345.62009号 ·doi:10.1002/9780470316801
[134] Alon U.,《美国国家学术科学学报》96页6745–(1999)·doi:10.1073/pnas.96.12.6745
[135] Golub TR,《科学》286 pp 531–(1999)·doi:10.1126/science.286.5439.531
[136] Dudoit S.,《美国统计协会杂志》97 pp 77–(2002)·Zbl 1073.62576号 ·doi:10.1198/016214502753479248
[137] Cover T.,IEEE信息理论学报pp IT–(1967)
[138] Schervish M.,美国统计学家,50 pp 203–(1996)
[139] Bayarri MJ,《美国统计协会杂志》95第1127页–(2000)
[140] Cabras S.,用微阵列数据分析中的频率学家p值控制错误发现率(2004)
[141] Müller P.,《美国统计协会杂志》99 pp 990-(2004)·Zbl 1055.62127号 ·doi:10.1198/0162145000001646
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。