×

结合基因表达数据和先验知识,使用结构限制通过贝叶斯网络推断基因调控网络。 (英语) Zbl 1420.92019年9月

摘要:基因调控网络(GRNs)被认为是最充分的工具,可以提供对细胞系统的清晰洞察和理解。使用基因表达数据重建GRN的最成功技术之一是贝叶斯网络(BN),它已被证明是学习过程中异构数据集成的理想方法。然而,通过使用先验信念或使用网络作为搜索过程的起点,已经实现了对先验知识的整合。在这项工作中,考虑了在从基因表达数据学习BNs的算法中使用不同类型的结构限制。这些限制将编纂先前的知识,以使BN满足这些限制。因此,本工作的一个目的是对利用先验知识和基因表达数据从BN推断GRN的方法进行详细综述,但本文的主要目的是研究基于表达式数据的BNs结构学习算法是否能够利用结构约束利用这些先验知识获得更好的结果。实验研究表明,这种融合先验知识的新方法使我们能够实现更好的反向工程网络。

MSC公司:

92C40型 生物化学、分子生物学
92立方厘米 系统生物学、网络
62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Acid,S.和L.M.de Campos(2003):“在限制非循环部分有向图空间中搜索贝叶斯网络结构”,J.Artif。《情报研究》,第18期,第445-490页·Zbl 1056.68142号
[2] Acid,S.,L.M.de Campos,J.M.Fernández-Luna,S.Rodríguez,J.M Rodráguez和J.L.Salcedo(2004):“贝叶斯网络学习算法的比较:基于急诊医疗服务数据的案例研究”,Artif。智力。医学,30,215-232。
[3] Acid,S.、L.M.de Campos和M.Fernández(2013):“通过搜索未训练的空间来学习马尔可夫边界的基于分数的方法”,Data Min.Knowl。光盘。,26, 174-212. ·Zbl 1260.68318号
[4] Aderhold,A.、D.Husmeier和M.Grzegorczyk(2014):“昼夜节律调节调节网络的统计推断”,《统计应用》。遗传学。Mo.B.,第13期,第227-273页·兹比尔1296.92011
[5] Almasri,E.、P.Larsen、G.Chen和Y.Dai(2008):“将文献知识纳入贝叶斯网络,以利用基因表达数据推断基因网络”,Lect。注释计算。科学,4983,184-195。
[6] Banf,M.和S.Y.Rhee(2017):“基因调控网络的计算推断:方法、限制和机会”,《生物化学》。生物物理学。《学报》,1860年,第1期,第41-52页。
[7] Bansal,M.、V.Belcastro、A.Ambesi-Impiombato和D.di Bernardo(2007):“如何从表达谱推断基因网络”,分子系统。生物学,3,1。doi:。 ·数字对象标识代码:10.1038/msb4100120
[8] Bellman,R.E.(1957):《动态编程》,普林斯顿大学出版社,新泽西州普林斯顿·Zbl 0077.13605号
[9] Buntine,W.(1991):《贝叶斯网络的理论改进》,载于:D'Ambrosio,Bruce D.,Smets,Philippe&Bonissone,Piero P.(编辑),《人工智能中的不确定性研究》,第52-60页。doi:。 ·doi:10.1016/B978-1-55860-203-8.50010-3
[10] Buntine,W.(1996):《从数据中学习概率网络的文献指南》,IEEE T.Knowl。数据En。,8, 195-210.
[11] Chai,L.E.、S.K.Loh、S.T.Low、M.S.Mohamad、S.Deris和Z.Zakaria(2014):“基因调控网络构建的计算方法综述”,《计算》。生物医学,48,55-65。
[12] Chen,G.,M.J.Cairelli,H.Kilicoglu,D.Shin和T.C.Rindflesch(2014):“利用基于文献的知识增强微阵列数据以增强基因调控网络推断”,《公共科学图书馆·计算》。生物,10,e1003666。doi:。 ·doi:10.1371/journal.pcbi.1003666
[13] Cheng,J.、R.Greiner、J.Kelly、D.Bell和W.Liu(2002):“从数据中学习贝叶斯网络:基于信息理论的方法”,Artif。智力。,137, 43-90. ·Zbl 0995.68114号
[14] Chickering,D.M.(1995):“等效贝叶斯网络结构的转换特征”,收录于:Besnard,Philippe&Hanks,Steve(编辑),《人工智能中的不确定性研究》,第87-98页。
[15] Cho,R.J.,M.J.Campbell,E.A.Winzeler,L.Steinmetz,A.Conway,L.Wodicka,T.G.Wolfsberg,A.E.Gabrielian,D.Landsman,D.J.Lockhart和R.W.Davis(1998):“有丝分裂细胞周期的全基因组转录分析”,分子细胞。,2, 65-73.
[16] Chow,C.和C.Liu(1968):“用依赖树逼近离散概率分布”,IEEE T.Inform。理论,1462-467·Zbl 0165.22305号
[17] Cooper、G.F.和E.Herskovits。(1992):“从数据中归纳概率网络的贝叶斯方法”,马赫。学习。,9, 309-347. ·Zbl 0766.68109号
[18] de Campos,L.M.和J.G.Castellano(2007):“使用结构限制的贝叶斯网络学习算法”,Int.J.近似原因。,45, 2, 233-254. ·Zbl 1122.68104号
[19] de Campos,L.M.和J.F.Huete(2000):“使用独立性标准学习信念网络的新方法”,Int.J.近似原因。,24, 11-37. ·Zbl 0995.68109号
[20] Djebbari,A.和J.Quackenbush(2008):“种子贝叶斯网络:从微阵列数据构建遗传网络”,BMC系统。生物学,2,57。
[21] Elvira Consortium(2002):“Elvira:概率图形模型的环境”,载于:Gámez,J.和A.Salmerón,(编辑),《概率图形模型第一届欧洲研讨会论文集》,第222-230页。
[22] Esteves,G.H.和L.F.L.Reis(2018):“测量基因调控网络激活的统计方法”,《Stat.Appl。遗传学。密苏里州,17,3。doi:·Zbl 1398.92088号 ·doi:10.1515/sagmb-2016-0059
[23] Friedman,N.(2004):“使用概率图形模型推断蜂窝网络”,《科学》,3035659799-805。
[24] Friedman,N.、M.Linial、I.Nachman和D.Peer(2000):“使用贝叶斯网络分析表达数据”,J.Compute。生物学,7601-620。
[25] Gámez,J.A.、J.L.Mateo和J.M.Puerta(2011):“通过爬山学习贝叶斯网络:基于邻域渐进限制的有效方法”,Data Min.Knowl。光盘。,22, 106-148. ·Zbl 1235.68152号
[26] Gifford,D.K.(2001):“基因山脉中的炽热路径”,《科学》,2932049-251年。
[27] Good,I.J.(1965):《概率估计》,麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0168.39603号
[28] Hartemink,A.J.、D.K.Gifford、T.S.Jaakkola和R.A.Young(2001年):“使用图形模型和基因组表达数据对遗传调控网络模型进行统计验证”,Pac。交响乐团。生物计算。,422-433. 内政部:。 ·doi:10.1142/9789812799623_0041
[29] Hartemink,A.J.,D.K.Gifford,T.S.Jaakkola和R.A.Young(2002a):“用于阐明遗传调控网络的贝叶斯方法”,IEEE Intelligence。系统。,17, 37-43.
[30] Hartemink,A.J.、D.K.Gifford、T.S.Jaakkola和R.A.Young(2002b):“结合位置和表达数据以原则性发现遗传调控网络模型”,太平洋时报。交响乐团。生物计算。,437-449. 内政部:。 ·doi:10.1142/9789812799623_0041
[31] Heckerman,D.、D.Geiger和D.M.Chickering(1995):“学习贝叶斯网络:知识和统计数据的结合”,马赫。学习。,20, 197-243. ·兹比尔08316.8096
[32] Hoefsloot,H.C.、S.Smit和A.K.Smile(2008):“莱顿蛋白质组学竞争的分类模型”,《统计应用》。遗传学。修订本B.7,2。doi:·Zbl 1276.62075号 ·doi:10.202/1544-6115.1351
[33] Hughes,T.R.,M.J.Marton,A.R.Jones,C.J.Roberts,R.Stoughton,C.D.Armour,H.A.Bennett,E.Coffey,H.Dai,Y.D.He,M.J.Kidd,A.M.King,M.R.Meyer,D.Slade,P.Y.Lum,S.B.Stepaniants,D.D.D.Shoemaker,D.Gachotte,K.Chakraburtty,J.Simon,M.Bard和S.H.Friend(2000):“通过表达式概要进行功能发现”,Cell,102,109-126。
[34] Imoto,S.,T.Higuchi,T.Goto,K.Tashiro,S.Kuhara和S.Miyano(2003a):“通过贝叶斯网络将微阵列和生物知识结合起来评估基因网络”,摘自:第二届IEEE计算机社会生物信息学会议,第104-113页。
[35] Imoto,S.、S.Kim、T.Goto、S.Miyano、S.Aburatani、K.Tashiro和S.Kuhara(2003b):“遗传网络非线性建模的贝叶斯网络和非参数异方差回归”,J.Bioinf。计算。生物学1,231-252。
[36] Imoto,S.,T.Higuchi,T.Goto,K.Tashiro,S.Kuhara和S.Miyano(2004):“将微阵列和生物学知识相结合,通过贝叶斯网络估计基因网络,”J.Bioinf。计算。生物学,277-98。
[37] Isci,S.、H.Dogan、C.Ozturk和H.H.Otu(2014):“贝叶斯网络先验:使用外部知识对生物数据进行网络分析”,生物信息学,30860-867。
[38] Kanehisa,M.,M.Araki,S.Goto,M.Hattori,M.Hirakawa,M.Itoh,T.Katayama,S.Kawashima,S.Okuda,T.Tokimatsu和Y.Yamanishi(2008):“用于将基因组与生命和环境相联系的KEGG”,核酸研究,36,480-484。
[39] Kim,H.、G.H.Golub和H.Park(2005):“DNA微阵列基因表达数据的缺失值估计:局部最小二乘插补”,生物信息学,21,187-198。
[40] Lam,W.和F.Bacchus(1994):“学习贝叶斯信念网络:基于MDL原则的方法”,Compu。智力。,10, 269-293.
[41] Larsen,P.、E.Almasri、G.Chen和Y.Dai(2007):“一种统计方法,用于结合生物学知识,从微阵列实验中生成可测试的新基因调控相互作用”,BMC生物信息学,8317。doi:。 ·doi:10.1186/1471-2105-8-317
[42] Le Phillip,P.、A.Bahl和L.H.Ungar(2004):“利用先验知识改进微阵列数据的遗传网络重建”,《硅生物学》,第4335-353页。
[43] Lee,W.P.和W.S.Tzou(2009):“从表达数据发现基因网络的计算方法”,简介。生物信息。,10, 408-423.
[44] Li,S.,L.Wu和Z.Zhang(2006):“通过结合文献挖掘和微阵列分析构建生物网络:LMMA方法”,生物信息学,22,2143-2150。
[45] Linde,J.、S.Schulze、S.G.Henkel和R.Guthke(2015):“基因调控网络的数据和知识建模:更新”,《实验与临床》。科学。,14, 346-378.
[46] Markowetz,F.和R.Spang(2007):“推断细胞网络——综述”,BMC生物信息学,8,6。doi:。 ·doi:10.1186/1471-2105-8-S6-S5
[47] Mewes,H.W.,D.Frishman,U.Güldener,G.Mannhaupt,K.F.X.Mayer,M.Mokrejs,B.Morgenstern,M.Münsterkötter,S.Rudd和B.Weil(2002):“MIPS:基因组和蛋白质序列数据库”,《核酸研究》,第30期,第31-34页。
[48] Mukherjee,S.和T.P.Speed(2008):“使用信息先验的网络推理”,PNAS,105,14313-14318。
[49] Nariai,N.、S.Kim、S.Imoto和S.Miyano(2004):“利用蛋白质相互作用来精炼贝叶斯网络从微阵列数据估计的基因网络”,Pac。交响乐团。生物计算。,336-347. 内政部:。 ·数字对象标识代码:10.1142/9789812704856_0032
[50] Nariai,N.、Y.Tamada、S.Imoto和S.Miyano(2005):“从多个全基因组数据估算酿酒酵母的基因调控网络和蛋白质相互作用”,生物信息学,21,206-212。
[51] Njah,H.和S.Jamoussi(2015):“基因调控网络贝叶斯网络的加权集成学习”,神经计算,150,404-416。
[52] Oates,C.J.,R.Amos和S.E.Spencer(2014):“量化网络推理算法的多尺度性能”,Stat.Appl。遗传学。Mo.B.,第13期,第611-631页·Zbl 1298.92043号
[53] Pearl,J.(1988):《智能系统中的概率推理:可信推理网络》,摩根·考夫曼出版社,旧金山(CA)。
[54] Sachs,K.,O.Perez,D.Peer,D.A.Lauffenburger和G.P.Nolan(2005):“源自多参数单细胞数据的因果蛋白信号网络”,《科学》,308,523-529。
[55] Sauta,E.、A.Demartini、F.Vitali、A.Riva和&R.Bellazzi(2017):“学习转录贝叶斯网络的数据融合方法”,《欧洲医学人工智能会议》,76-80。内政部:。 ·doi:10.1007/978-3-319-59758-48
[56] Schlitt,T.和A.Brazma(2007):“基因调控网络建模的当前方法”,BMC生物信息学,8,6。doi:。 ·doi:10.1186/1471-2105-8-S6-S9
[57] Segal,E.、H.Wang和D.Koller(2003):“从蛋白质相互作用和基因表达数据中发现分子途径”,《生物信息学》,第19卷,第264-i272页。
[58] Spellman,P.T.,G.Sherlock,M.Q.Zhang,V.R.Iyer,K.Anders,M.B.Eisen,P.O.Brown,D.Botstein和B.Futcher(1998):“通过微阵列杂交综合鉴定酿酒酵母的细胞周期调节基因”,《分子生物学》。单元格,93273-3297。
[59] Spites,P.、C.Glymour和R.Scheines(1993):因果关系、预测和搜索,麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0806.62001
[60] Spirtes,P.,C.Glymour,R.Scheines,S.Kauffman,V.Aimale和F.Wimberly(2000):“从微阵列数据构建基因表达网络的贝叶斯网络模型”,摘自:计算生物学大西洋研讨会论文集,基因组信息系统和技术,doi:。 ·doi:10.1184/R1/6491291.v1
[61] Spites,P.、C.Glymour和R.Scheines(2001):因果关系、预测和搜索,第2版,麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0981.62001号
[62] Stacklies,W.、H.Redestig、M.Scholz、D.Walther和J.Selbig(2007):“pcaMethods——为不完整数据提供PCA方法的生物导体包”,生物信息学,231164-1167。
[63] Steele,E.、A.Tucker、P.Hoen和M.Schuemie(2009):“基因调控网络的基于文献的先验”,生物信息学,251768-1774。
[64] Styczynski,M.P.和G.Stephanopulos(2005):“基因调控网络推断的计算方法概述”,《计算》。化学。工程,29,519-534。
[65] Tamada,Y.、S.Kim、H.Bannai、S.Imoto、K.Tashiro、S.Kuhara和S.Miyano(2003a):“将基因表达数据与DNA序列信息结合起来,以使用贝叶斯网络模型估计基因网络”,《基因组信息》。序列号。,14, 352-353.
[66] Tamada,Y.,S.Kim,H.Bannai,S.Imoto,K.Tashiro,S.Kuhara和S.Miyano(2003b):“通过将贝叶斯网络模型与启动子元件检测相结合,从基因表达数据中估计基因网络,”生物信息学,19,227-236。
[67] Wang,M.,Z.Chen和S.Cloutier(2007):“构建基因网络的混合贝叶斯网络学习方法”,计算。生物化学。,31, 361-372. ·Zbl 1141.92319号
[68] Wang,Y.R.和H.Huang(2014):“利用表达数据重建基因网络的统计方法综述”,J.Theor。生物学,362,53-61·Zbl 1307.92099号
[69] Werhli,A.V.、M.Grzegorczyk和D.Husmeier(2006):“反向工程基因调控网络与相关网络、图形高斯模型和贝叶斯网络的比较评估”,生物信息学,22,2523-2531。
[70] Werhli,A.V.和D.Husmeier(2007a):“通过将表达数据与多种先验知识来源相结合,用贝叶斯网络重建基因调控网络”,《Stat.Appl。遗传学。Mo.B.,6,1。doi:·Zbl 1166.62373号 ·doi:10.202/1544-6115.1282
[71] Werhli,A.V.和D.Husmeier(2007b):“利用贝叶斯网络从表达数据结合多种生物先验知识源反向工程基因调控网络”,Lect。N.生物信息。,49, 1-2.
[72] Wit,E.和J.Mcclure(2004):微阵列统计,英国奇切斯特John Wiley&Sons·Zbl 1049.62120号
[73] Yu,J.,V.A.Smith,P.P.Wang,A.J.Hartemink和E.D.Jarvis(2004):“从观测生物数据生成因果网络的贝叶斯网络推理进展”,生物信息学,20,3594-3603。
[74] Zhou,H.和T.Zheng(2014):“利用基因表达数据进行通路分析的贝叶斯层次图结构模型”,《统计应用》。遗传学。Mo.B.,第12期,第393-412页。
[75] Zhu,J.,B.Zhang,E.N.Smith,B.Drees,R.B.Brem,L.Kruglyak,R.E.Bumgarner和E.E.Schadt(2008):“整合大规模功能基因组数据,剖析酵母调控网络的复杂性,”自然遗传学。,40, 854-861.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。