×

在高通量实验中识别差异共表达的经验贝叶斯方法。 (英语) Zbl 1251.62042号

摘要:微阵列和相关高通量基因组实验的一个共同目标是识别不同生物条件下的基因。大多数情况下,这是通过识别平均表达水平发生变化的基因,即所谓的差异表达(DE)基因来实现的,并且已经开发了许多识别DE基因的有效方法。尽管这些方法很有用,但不适用于其他类型的差别管制。一个重要的例子涉及差异共表达(DC)。这类基因的研究受到待询问空间的大基数以及有影响力的离群值的阻碍。因此,现有的DC方法往往动力不足,极易出现错误发现,和/或即使对数量适中的数据对也难以计算。为了解决这个问题,开发了一种用于识别DC基因对的经验贝叶斯方法。该方法提供了一个错误的发现率控制的重要DC基因对列表,而不会牺牲能量。它既适用于单个研究,也适用于多个研究。通过修改期望最大化算法和过程启发式,计算大大简化。仿真结果表明,该方法的计算时间远小于现有方法;案例研究结果表明,在高通量基因组研究中,该方法可能被证明是对当前DE方法的有益补充。

MSC公司:

62页第10页 统计学在生物学和医学科学中的应用;元分析
62C12号机组 经验决策程序;经验贝叶斯程序
92D10型 遗传学和表观遗传学
92C40型 生物化学、分子生物学
92 C50 医疗应用(通用)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Barry,微阵列数据中测试功能类别的统计框架,《应用统计年鉴》第2卷第286页–(2008年)·Zbl 1137.62390号 ·doi:10.1214/07-AOAS146
[2] Bartlett,《判别分析中的逆矩阵调整》,《数理统计年鉴》22第107页–(1951)·Zbl 0042.38203号 ·doi:10.1214/aoms/1177729698
[3] Bartlett,皮尔逊积矩相关系数的线性建模:Fisher z变换的应用,皇家统计学会杂志,D系列42第45页–(1993)
[4] 贝尔,指数,《美国数学月刊》41页411–(1934)·兹比尔0010.05401 ·数字对象标识代码:10.2307/2300300
[5] 伯杰,统计决策理论和贝叶斯分析(1980)·doi:10.1007/978-1-4757-1727-3
[6] Bolstad,《基于偏差和方差的高密度寡核苷酸阵列数据归一化方法的比较》,《生物信息学》第19卷第185页–(2003年)·doi:10.1093/bioinformatics/19.2.185
[7] Broet,用于识别微阵列实验中基因表达变化的贝叶斯层次模型,《计算生物学杂志》9第671页–(2002)·doi:10.1089/106652702760277381
[8] Chan、Bcl-2和p53蛋白在人类上皮性卵巢癌中的表达、凋亡和p53突变,《美国病理杂志》156页409-(2000)·doi:10.1016/S0002-9440(10)64744-X
[9] Choi,利用微阵列数据进行差异共表达分析及其在人类癌症中的应用,生物信息学21,第4348页–(2005)·doi:10.1093/bioinformatics/bti722
[10] de la Fuente,从“差异表达”到“差异网络”-识别疾病中功能失调的调节网络,《遗传学趋势》26,第326页–(2010年)·doi:10.1016/j.tig.2010.05.001
[11] Dempster,通过em算法获得不完整数据的最大似然,皇家统计学会杂志,B系列39第1页–(1977)·Zbl 0364.62022号
[12] Fisher,《多重相关系数的一般抽样分布》,《皇家统计学会杂志》,A辑121页654–(1928)·JFM 54.0558.03标准
[13] 弗雷利,基于模型的聚类、判别分析和密度估计,《美国统计协会杂志》97 pp 611–(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[14] Fraley,C.Raftery,A.E.2006 MCLUST第3版R:正态混合建模和基于模型的聚类
[15] Gorlov,前列腺癌候选途径和基因:基因表达数据的荟萃分析,BMC Medical Genomics 2,第48页–(2009)·doi:10.1186/1755-8794-2-48
[16] Harville,《统计学家视角下的矩阵代数》(1997)·Zbl 0881.15001号 ·数字对象标识代码:10.1007/b98818
[17] Hu,《在微阵列分析中检测基因间相关性变化:基因选择的新方法》,BMC生物信息学10 pp 20–(2009)·Zbl 05739550号 ·doi:10.1186/1471-2105-10-20
[18] 胡,基于协方差距离的新基因选择程序,生物信息学26 pp 348–(2010)·兹比尔05744491 ·doi:10.1093/bioinformatics/btp672
[19] Irizarry,《Affymetrix基因芯片探针水平数据摘要》,《核酸研究》31页e15–(2003)·doi:10.1093/nar/gng015
[20] 加藤,复制许可因子MCM2和MCM3在正常、增生和癌子宫内膜中的表达:与Ki-67和雌孕激素受体表达的相关性,《国际妇科病理学杂志》22第334页–(2003)·doi:10.1097/01.第0000092129.10100.5e页
[21] Keller,2型糖尿病基因表达网络模型将胰岛细胞周期调节与糖尿病易感性联系起来,《基因组研究》18第706页–(2008)·doi:10.1101/gr.074914.107
[22] Kendziorski,《利用重复基因表达谱比较多组的参数经验贝叶斯方法》,《医学统计学》22,第3899页–(2003)·doi:10.1002/sim.1548
[23] Lai,鉴定差异基因-基因共表达模式的统计方法,生物信息学20第3146页–(2004)·doi:10.1093/bioinformatics/bth379
[24] 朗福德,正相关的性质是传递的吗?,《美国统计学家》55页322页–(2001年)·doi:10.1198/00031701753272286
[25] Li,《全基因组共表达动力学:理论与应用》,PNAS 99 pp 16875–(2002)·doi:10.1073/pnas.252466999
[26] Mardia,多元分析(1979)
[27] 孟,EM算法——一首古老的民歌,随着一个快速的新调子而唱,《皇家统计学会杂志》,B辑59,第511页–(1997)·Zbl 1090.62518号 ·数字对象标识代码:10.1111/1467-9868.00082
[28] Mentzen,《解剖小鼠乳腺良性肿瘤细胞过程失调的动力学》,BMC Genomics 10 pp 601–(2009)·doi:10.1186/1471-2164-10-601
[29] Newton,《随机集方法识别基因集分析中富集信号的不同方面》,《应用统计学年鉴》1第85页–(2007)·Zbl 1129.62103号 ·doi:10.1214/07-AOAS104
[30] Pollack,《病理学研究和实践中的dna微阵列透视》,《美国病理学杂志》171,第375页–(2007)·doi:10.2353/ajpath.2007070342
[31] Powell,无导数约束优化的BOBYQA算法(2009)
[32] 邱,标准化对微阵列数据相关结构的影响,BMC生物信息学6 pp 120–(2005)·doi:10.1186/1471-2105-6-120
[33] R开发核心团队,R:统计计算的语言和环境(2009)
[34] Smyth,《使用R和生物导体的生物信息学和计算生物学解决方案》,第397页–(2005年)·数字对象标识代码:10.1007/0-387-29362-023
[35] Storey,《错误发现率的直接方法》,《皇家统计学会杂志》,B辑,第62页,第479页–(2002)·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[36] Subramanian,基因集富集分析:解释全基因组表达谱的基于知识的方法,PNAS 102 pp 15545–(2005)·doi:10.1073/pnas.0506580102
[37] Takei,从携带高度调节野生型tp53的结肠癌细胞系中分离出新的tp53靶基因,《基因、染色体和癌症》23 pp 1–(1998)·doi:10.1002/(SICI)1098-2264(199809)23:1<1::AID-GCC1>3.0.CO;2年
[38] 2011年人类基因简编http://genecards.org/cgi-bin/carddisp.pl?gene=PARM1
[39] Watson,Coxpress:基因表达数据中的差异共表达,BMC生物信息学7 pp 509–(2006)·doi:10.1186/1471-2105-7-509
[40] Wilcox,稳健估计和假设检验导论(1997)·Zbl 0991.62508号
[41] 雅科夫列夫,微阵列数据分析的统计方法(2010年)
[42] Zilliox,微阵列数据的基因表达条形码,《自然方法》第4页,911–(2007)·doi:10.1038/nmeth1102
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。