×

微阵列实验中的多重假设检验。 (英语) Zbl 1048.62099号

摘要:DNA微阵列是一种新的、有前途的生物技术的一部分,它可以同时监测数千个基因在细胞中的表达水平。DNA微阵列实验中一个重要而常见的问题是鉴别差异表达基因,即其表达水平与相关反应或协变量相关的基因。差异表达的生物学问题可以重新表述为多重假设检验中的一个问题:同时检验每个基因的无效假设,即表达水平与响应或协变量之间没有关联。作为一个典型的微阵列实验,同时测量数千个基因的表达水平,会产生大量的多样性问题。本文讨论了在DNA微阵列实验背景下进行多假设检验的不同方法,并比较了微阵列和模拟数据集的程序。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
62F03型 参数假设检验

软件:

R(右)斯马
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alizadeh,A.A.、Eisen,M.B.、Davis,R.E.、Ma,C.、Lossos,I.S.、Rosenwald,A.、Boldrick,J.C.、Sabet,H.、Tran,T.、Yu,X.、Powell,J.I.、Yang,L.、Marti,G.E.、Moore,T.,Hudson Jr.,J.、Lu,L.,Lewis,D.B.、Tibshirani,R.、Sherlock,G.、Chan,W.C.、Greiner,T.C.、Weisenburger,D.、Armitage,J.O.、Warnke,R.,Levy,R.和Wilson,W。,Grever,M.R.、Byrd,J.C.、Botstein,D.、Brown,P.O.和Staudt,L.M.(2000)。通过基因表达谱确定不同类型的弥漫性大B细胞淋巴瘤。自然403 503–511。
[2] Alon,U.、Barkai,N.、Notterman,D.A.、Gish,K.、Ybara,S.、Mack,D.和Levine,A.J.(1999)。寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示了广泛的基因表达模式。程序。国家。阿卡德。科学。美国96 6745–6750。
[3] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B 57 289–300·Zbl 0809.62014号
[4] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165–1188. ·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[5] Beran,R.(1988)。平衡的同时置信集。J.Amer。统计师。协会83 679–686·Zbl 0662.62031号 ·doi:10.2307/2289291
[6] Boldrick,J.C.、Alizadeh,A.A.、Diehn,M.、Dudoit,S.、Liu,C.L.、Belcher,C.E.、Botstein,D.、Staudt,L.M.、Brown,P.O.和Relman,D.A.(2002年)。人类对细菌的先天免疫反应中的定型和特异性基因表达程序。国家。阿卡德。科学。美国99 972–977。
[7] Braver,S.L.(1975)。关于不等分尾部:单尾与双尾测试的新观点。教育和心理测量35 283–301。
[8] Brown,P.O.和Botstein,D.(1999)。用DNA微阵列探索基因组的新世界。《自然遗传学》21 33–37。
[9] Buckley,M.J.(2000年)。现场用户指南。澳大利亚新南威尔士州北莱德CSIRO数学和信息科学。可在http://www.cmis.csiro.au/IAP/Spot/spotmanual.htm。
[10] Callow,M.J.、Dudoit,S.、Gong,E.L.、Speed,T.P.和Rubin,E.M.(2000)。微阵列表达谱确定HDL缺乏小鼠中表达改变的基因。基因组研究2022-2029年10月。
[11] Chu,G.、Goss,V.、Narasimhan,B.和Tibshirani,R.(2000)。SAM(微阵列显著性分析)-用户指南和技术文档。斯坦福大学技术报告。
[12] Dudoit,S.、Shaffer,J.P.和Boldrick,J.C.(2002年)。微阵列实验中的多重假设检验。加州大学伯克利分校生物统计处技术报告110。可在http://www.bepress.com/ucbbiostat/纸张110/·Zbl 1048.62099号 ·doi:10.1214秒/1056397487
[13] Dudoit,S.、Yang,Y.H.、Callow,M.J.和Speed,T.P.(2002)。在复制cDNA微阵列实验中识别差异表达基因的统计方法。统计师。Sinica 12 111–139·Zbl 1004.62088号
[14] Dunn,O.J.(1958)。因变量均值的估计。安。数学。统计师。29 1095–1111. ·Zbl 0092.36702号 ·doi:10.1214/aoms/1177706443
[15] Efron,B.、Storey,J.D.和Tibshirani,R.(2001)。微阵列、经验贝叶斯方法和错误发现率。技术报告2001-23B/217,斯坦福大学统计系·Zbl 1073.62511号
[16] Efron,B.、Tibshirani,R.、Goss,V.和Chu,G.(2000年)。微阵列及其在比较实验中的应用。技术报告2000-37B/213,斯坦福大学统计系。
[17] Efron,B.、Tibshirani,R.、Storey,J.D.和Tusher,V.(2001)。微阵列实验的经验贝叶斯分析。J.Amer。统计师。协会96 1151–1160·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[18] Finner,H.(1999)。逐步多重测试程序和方向误差控制。安。统计师。27 274–289. ·Zbl 0978.62057号 ·doi:10.1214/aos/1018031111
[19] Gabriel,K.R.(1975年)。MANOVA中几种同时推理方法的比较。《多元统计方法:组间协变》(W.R.Atchley和E.H.Bryant编辑)61-80。Dowden、Hutchinson和Ross,宾夕法尼亚州斯特劳德斯堡。
[20] Ge,Y.,Dudoit,S.和Speed,T.P.(2003)。用于微阵列数据分析的基于重采样的多重测试。测试·Zbl 1056.62117号 ·doi:10.1007/BF02595811
[21] Genovese,C.和Wasserman,L.(2001)。FDR程序的操作特点和扩展。卡内基梅隆大学统计系技术报告737·Zbl 1090.62072号
[22] Golub,T.R.、Slonim,D.K.、Tamayo,P.、Huard,C.、Gaasenbeek,M.、Mesirov,J.P.、Coller,H.、Loh,M.,Downing,J.R.,Caligiuri,M.A.、Bloomfield,C.D.和Lander,E.S.(1999)。癌症的分子分类:通过基因表达监测进行分类发现和分类预测。科学286 531–537·Zbl 1047.65504号
[23] Hochberg,Y.(1988)。用于多个重要测试的更清晰的Bonferroni程序。生物特征75 800–802·兹比尔0661.62067 ·doi:10.1093/生物技术/75.4800
[24] Hochberg,Y.和Tamhane,A.C.(1987年)。多重比较程序。纽约威利·Zbl 0731.62125号
[25] Holm,S.(1979年)。一个简单的顺序拒绝多重测试程序。扫描。J.统计。6 65–70. ·Zbl 0402.62058号
[26] Hommel,G.(1988)。基于改进的Bonferroni试验的分阶段拒绝多重试验程序。生物特征75 383–386·Zbl 0639.62025号 ·doi:10.1093/biomet/75.2.383
[27] Hommel,G.和Bernhard,G.(1999年)。逻辑相关假设的Bonferroni程序。J.统计。计划。推论82 119-128·Zbl 1079.62526号 ·doi:10.1016/S0378-3758(99)00035-X
[28] Ihaka,R.和Gentleman,R.(1996)。R: 用于数据分析和图形的语言。J.计算。图表。统计师。5 299–314.
[29] Jogdeo,K.(1977年)。关联和概率不等式。安。统计师。5 495–504. JSTOR公司:·Zbl 0401.62028号 ·doi:10.1214/aos/1176343846
[30] Kerr,M.K.、Martin,M.和Churchill,G.A.(2000年)。基因表达微阵列数据的方差分析。计算生物学杂志7 819–837。
[31] Krishnaiah,P.R.和Reising,J.M.(1985)。多元多重比较。统计科学百科全书6 88-95。纽约威利。
[32] Lehmann,E.L.(1986)。《检验统计假设》,第二版,威利出版社,纽约·Zbl 0608.62020
[33] Lipshutz,R.J.、Fodor,S.、Gingeras,T.R.和Lockhart,D.J.(1999)。高密度合成寡核苷酸阵列。《自然遗传学》21 20–24。
[34] Lönnstedt,I.和Speed,T.P.(2002)。复制微阵列数据。统计师。中国12 31–46·Zbl 1004.62086号
[35] Manduchi,E.、Grant,G.R.、McKenzie,S.E.、Overton,G.C.、Surrey,S.和Stoeckert Jr.,C.J.(2000年)。通过为差异表达基因分配置信度,从基因表达数据生成模式。生物信息学16 685–698。
[36] Mayo,D.和Spanos,A.(2002年)。Neyman–Pearson测试的严格测试解释。未发布·Zbl 1098.03030号
[37] 莫里森·D·F(1990)。多元统计方法,第三版,纽约McGraw-Hill·Zbl 0183.20605号
[38] 国家阅读小组(1999年)。教孩子们阅读。报告,国家儿童健康和人类发展研究所,国家卫生研究所。
[39] Newton,M.A.、Kendziorski,C.M.、Richmond,C.S.、Blattner,F.R.和Tsui,K.W.(2001)。关于表达比率的差异变异性:改进微阵列数据中关于基因表达变化的统计推断。计算生物学杂志8 37-52。
[40] Pepe,M.S.、Longton,G.、Anderson,G.L.和Schummer,M.(2003)。从微阵列实验中选择差异表达基因。生物统计学59·Zbl 1210.62200号 ·doi:10.1111/1541-0420.0016
[41] Perou,C.M.、Jeffrey,S.S.、van de Rijn,M.、Rees,C.A.、Eisen,M.B.、Ross,D.T.、Pergamenschikov,A.、Williams,C.F.、Zhu,S.X.、Lee,J.C.F.、Lashkari,D.、Shalon,D.、Brown,P.O.和Botstein,D.(1999)。人类乳腺上皮细胞和乳腺癌中不同的基因表达模式。程序。国家。阿卡德。科学。96 9212–9217.
[42] Pollack,J.R.、Perou,C.M.、Alizadeh,A.A.、Eisen,M.B.、Pergamenschikov,A.、Williams,C.F.、Jeffrey,S.S.、Botstein,D.和Brown,P.O.(1999)。使用cDNA微阵列对DNA拷贝数变化进行全基因组分析。《自然遗传学》23 41–46。
[43] Pollard,K.S.和van der Laan,M.J.(2003年)。基于重采样的多重检验,具有I型误差的渐近强控制。提交。
[44] Ramsey,P.H.(1978)。两两多重比较之间的功率差异。J.Amer。统计师。协会73 479–485·Zbl 0391.62051号 ·doi:10.2307/2286584
[45] Reiner,A.、Yekutieli,D.和Benjamini,Y.(2001)。使用基于重采样的FDR控制多个测试程序来分析微阵列基因表达数据。未发布。
[46] Rom,D.M.(1990年)。基于修正的Bonferroni不等式的顺序拒绝测试程序。生物特征77 663–665·doi:10.307/2337008
[47] Ross,D.T.、Scherf,U.、Eisen,M.B.、Perou,C.M.、Rees,C.、Spellman,P.、Iyer,V.、Jeffrey,S.、van de Rijn,M.、Waltham,M.,Pergamenschikov,A.、Lee,J.C.F.、Lashkari,D.、Shalon,D.、Myers,T.G.、Weinstein,J.N.、Botstein,D.和Brown,P.O.(2000)。人类癌症细胞系中基因表达模式的系统变异。《自然遗传学》24 227–234。
[48] Scheffé,H.(1959年)。方差分析。纽约威利·Zbl 0086.34603号
[49] Seeger,P.(1968年)。关于整体意义分析方法的注释。技术计量学10 586–593。
[50] Shaffer,J.P.(1986)。按顺序修改拒绝多项试验程序。J.Amer。统计师。协会81 826–831·Zbl 0603.62087号 ·doi:10.2307/2289016
[51] Shaffer,J.P.(1995)。多重假设检验:综述。心理学年鉴46 561-584。
[52] Shaffer,J.P.(2002)。多重性、方向(III型)错误和零假设。心理学方法7 356–369。
[53] 什伊达克(1967)。多元正态分布均值的矩形置信区。J.Amer。统计师。协会62 626–633·Zbl 0158.17705号 ·doi:10.2307/2283989
[54] Simes,R.J.(1986)。一种改进的Bonferroni程序,用于多项显著性测试。生物计量学73 751–754·Zbl 0613.62067号 ·doi:10.1093/biomet/73.3.751
[55] Sorić,B.(1989年)。统计“发现”和效应大小估计。J.Amer。统计师。协会84 608–610。
[56] Storey,J.D.(2001)。错误发现率:贝叶斯解释和q值。斯坦福大学统计系2001-12年技术报告。
[57] Storey,J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B统计方法。64 479–498. ·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[58] Storey,J.D.和Tibshirani,R.(2001)。估计依赖性下的阳性假发现率,并应用于DNA微阵列。《2001-28年技术报告》,斯坦福大学统计学系。
[59] Tibshirani,R.、Hastie,T.、Narasimhan,B.、Eisen,M.、Sherlock,G.、Brown,P.和Botstein,D.(2002)。从微阵列实验中探索性筛选基因和簇。统计师。Sinica 12 47–59·Zbl 1004.62085号
[60] Troendle,J.F.(1996)。一种测试多种结果的排列逐步方法。生物统计学52 846–859·Zbl 1077.62517号 ·doi:10.2307/2533047
[61] Tusher,V.G.、Tibshirani,R.和Chu,G.(2001)。微阵列用于电离辐射反应的显著性分析。程序。国家。阿卡德。科学。美国98 5116–5121·2014年12月10日 ·doi:10.1073/美国国家统计局091062498
[62] van der Laan,M.J.和Bryan,J.(2001)。参数引导法的基因表达分析。生物统计学2 445–461·Zbl 1097.62571号 ·doi:10.1093/biostatistics/2.4.445
[63] Westfall,P.H.和Young,S.S.(1993年)。基于重采样的多重测试:(p\)值调整的示例和方法。纽约威利·Zbl 0850.62368号
[64] Westfall,P.H.、Zaykin,D.V.和Young,S.S.(2001)。关联研究中遗传效应的多重测试。《生物统计方法》(S.Looney,ed.)143–168。新泽西州托托瓦市Humana。
[65] Wright,S.P.(1992年)。同时推理的调整值。生物计量学48 1005–1013。
[66] Yang,Y.H.、Buckley,M.J.、Dudoit,S.和Speed,T.P.(2002)。cDNA微阵列数据图像分析方法的比较。J.计算。图表。统计师。11 108–136. ·Zbl 04572920号 ·doi:10.1198/106186002317375640
[67] Yang,Y.H.,Dudoit,S.,Luu,P.和Speed,T.P.(2001)。cDNA微阵列数据的归一化。《微阵列:光学技术和信息学》(M.L.Bittner、Y.Chen、A.N.Dorsel和E.R.Dougherty编辑)141-152。华盛顿州贝灵汉SPIE。
[68] Yekutieli,D.和Benjamini,Y.(1999年)。基于重采样的错误发现率控制相关测试统计的多个测试过程。J.统计。计划。推论82 171-196·Zbl 1063.62563号 ·doi:10.1016/S0378-3758(99)00041-5
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。