×

多重测试中错误发现率的估计:应用于基因微阵列数据。 (英语) Zbl 1190.62133号

摘要:用DNA微阵列实验中的基因表达数据进行显著性测试需要同时比较数百或数千个基因。如果\(R)表示拒绝的数量(声明的重要基因),V表示错误拒绝的数量,那么\(V/R),如果\(R>0),是错误拒绝假设的比例。本文提出了一个拒绝数分布模型,以及给定(R),(V,|,R)的条件分布。在独立性假设下,(R)的分布是两个二项式的卷积,而(V,|,R)的分配是非中心超几何分布。在等相关模型下,分布更为复杂,也进行了推导。
考虑了五种错误发现率概率误差度量:(text{FDR}=E(V/R)),(p{FDR{=E(V/R,|\,R>0)(正FDR),(c\text{FDRneneneep=E(V/R,|,R=R))(条件FDR)、mFDR=E(V)/E(R)(边际FDR)和(E\text{FDR}=E(V)/R)(经验FDR)。在贝叶斯框架下,(p)FDR、(c)FDR和(m)FDR被证明是等价的,其中真零假设的数量被建模为随机变量。我们提出了一种参数化和自举方法来估计FDR。通过蒙特卡罗模拟来评估这两种方法的性能。bootstrap程序似乎表现得相当好,即使替代假设相互关联(rho=.25)。以一个产毒基因芯片实验为例进行说明。

MSC公司:

第62页第15页 配对和多重比较;多次测试
62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
92D10型 遗传学和表观遗传学
62E15型 统计学中的精确分布理论
2015年1月62日 贝叶斯推断
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahn H.,《计算与图形统计杂志》,第4页,第55页–(1995年)
[2] Benjamini Y.,《皇家统计学会杂志》,B辑57,第289页–(1995)
[3] Benjamini Y.,《教育与行为统计杂志》,25页,第60页–(2000年)
[4] 内政部:10.1016/S0378-3758(99)00040-3·doi:10.1016/S0378-3758(99)00040-3
[5] Dudoit S.,《中国统计》12第111页–(2002)
[6] Hochberg Y.,Biometrika 75 pp 800–(1988)
[7] Hochberg Y.,《多重比较程序》(1987)·Zbl 0731.62125号 ·数字对象标识代码:10.1002/9780470316672
[8] Holm S.,《斯堪的纳维亚统计杂志》,第6页,第65页–(1979年)
[9] DOI:10.1081/BIP-120024202·Zbl 1197.62095号 ·doi:10.1081/BIP-120024202
[10] Kerr M.K.,《中国统计》12(1)第203页–(2002)
[11] DOI:10.1016/S0378-3758(01)00252-X·Zbl 1009.62059号 ·doi:10.1016/S0378-3758(01)00252-X
[12] 萨维尔·D·J,《美国统计学家》44页174页–(1990)
[13] Schweder T.,Biometrika 69第493页–(1982)
[14] 内政部:10.1111/1467-9868.00346·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[15] 内政部:10.1073/pnas.091062498·2014年12月10日 ·doi:10.1073/pnas.091062498
[16] 韦勒J.I.,《遗传学》150页1699–(1998)
[17] Westfall P.H.,基于重采样的多重测试(1993)
[18] Westfall P.H.,《生物统计方法》第43页–(2001)
[19] DOI:10.1016/S0378-3758(99)00041-5·Zbl 1063.62563号 ·doi:10.1016/S0378-3758(99)00041-5
[20] Zaykin D.V.,《遗传学》第154页,1917年–(2000年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。