×

利用低阶条件独立性推断动态基因调控网络——对该方法的评估。 (英文) Zbl 1461.92033号

总结:十多年前,S.Lèbre公司【Stat.Appl.Genet.Mol.Biol.8,No.1,Article No.9,38 p.(2009;Zbl 1276.62080号)]提出了一种从高维稀疏时间序列基因表达数据中学习基因调控网络结构的推理方法G1DBN。他们的方法基于低阶条件独立图的概念,并将其扩展到动态贝叶斯网络(DBN)。他们提出的结果表明,与相关的Lasso和Shrinkage方法相比,他们的方法产生了更好的结构精度,尤其是在数据稀疏的情况下,即时间测量的数量(n)远小于基因的数量(p)。本文通过仔细的实验分析对这些说法提出了质疑,以表明使用G1DBN方法从时间序列数据反向构建的GRN不如[loc.cit.]所声称的准确。我们还表明,与G1DBN方法相比,Lasso方法对从模拟数据中学习的图形产生了更高的结构精度,尤其是当数据稀疏时。Lasso方法在识别参与细胞周期的转录因子(TF)方面也优于G1DBN酿酒酵母.

MSC公司:

92立方厘米 系统生物学、网络
92天10分 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altman,N.和Krzywinski,M.(2018年)。维度的诅咒。自然方法15:399-400,doi:10.1038/s41592-018-0019-x·数字对象标识代码:10.1038/s41592-018-0019-x
[2] Bernard,A.和Hartemink,A.J.(2005年)。信息结构优先:从多种类型的数据中联合学习动态监管网络。In:生物计算。《世界科学》,美国夏威夷,第459-470页。
[3] Campos,L.M.d.(2006年)。基于互信息和条件独立性测试的贝叶斯网络学习评分函数。J.马赫。学习。决议7:2149-2187·Zbl 1222.62036号
[4] Chai,L.E.、Loh,S.K.、Low,S.T.、Mohamad,M.S.、Deris,S.和Zakaria,Z.(2014)。基因调控网络构建的计算方法综述。计算。《生物医学》48:55-65,doi:10.1016/j.compbiomed.2014.02.011·doi:10.1016/j.compbiomed.2014.02.011
[5] Charbonnier,C.、Chiquet,J.和Ambroise,C.(2010年)。用于从时间进程数据进行结构化网络推理的加权LASSO。统计应用程序。遗传学。分子生物学。9,doi:10.2202/1544-6115.1519·Zbl 1304.92085号 ·doi:10.2202/1544-6115.1519
[6] Chaturvedi,I.和Rajapakse,J.C.(2010年)。构建具有时滞规则的基因网络。模式识别。莱特。31:2133-2137,doi:10.1016/j.patrec.2010.03.002·doi:10.1016/j.patrec.2010.03.002
[7] Cho,K.-H.、Choo,S.-M.、Jung,S.、Kim,J.-R.、Choi,H.-S.和Kim,J。(2007年)。基因调控网络的逆向工程。IET系统。生物学杂志1:149-163,doi:10.1049/iet-syb:20060075·doi:10.1049/iet-syb:20060075
[8] Csala,A.、Voorbraak,F.P.、Zwinderman,A.H.和Hof,M.H.(2017年)。高维遗传和基因组数据的稀疏冗余分析。生物信息学33:3228-3234,doi:10.1093/Bioinformatics/btx374·doi:10.1093/生物信息学/btx374
[9] De Campos,C.P.和Ji,Q.(2011)。使用约束的贝叶斯网络的有效结构学习。J.马赫。学习。决议12:663-689·Zbl 1280.68226号
[10] Delgado,F.M.和Gómez-Vela,F.(2019年)。基因调控网络重建和分析的计算方法:综述。Artif公司。智力。Med.95:133-145,doi:10.1016/j.artmed.2018.10.006·doi:10.1016/j.artmed.2018.10.006
[11] D'haeseler,P.、Wen,X.、Fuhrman,S.和Somogyi,R.(1999)。CNS发育和损伤期间mRNA表达水平的线性建模。摘自:99年生物计算。《世界科学》,美国夏威夷,第41-52页。
[12] Dojer,N.、Gambin,A.、Mizera,A.、Wilczynski,B.和Tiuryn,J.(2006)。将动态贝叶斯网络应用于扰动的基因表达数据。BMC生物信息。7,doi:10.1186/1471-2105-7-249·doi:10.1186/1471-2105-7-249
[13] Dondelinger,F.、Lèbre,S.和Husmeier,D.(2010年)。具有灵活结构和跨时间段信息共享的异构连续动态贝叶斯网络。摘自:第27届国际机器学习会议论文集。Omnipress,以色列海法,第303-310页。
[14] Dondelinger,F.、Lèbre,S.和Husmeier,D.(2013年)。具有贝叶斯正则化的非同源动态贝叶斯网络,用于推断具有渐变结构的基因调控网络。机器。学习。90:191-230,doi:10.1007/s10994-012-5311-x·Zbl 1260.92027号 ·doi:10.1007/s10994-012-5311-x
[15] Dong,X.、Yambartsev,A.、Ramsey,S.A.、Thomas,L.D.、Shulzhenko,N.和Morgun,A.(2015)。从大数据反向生成监管网络:生物学家的路线图。生物信息学。《生物学观察》9,BBI-S12467,doi:10.4137/BBI.S12467·doi:10.4137/bbi.s12467
[16] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004)。最小角度回归。Ann.Stat.32:407-499·Zbl 1091.62054号
[17] Ekström,C.T.(2020年)。MESS:各种深奥的统计脚本,R包版本0.5.7。
[18] Enright,C.G.和Madden,M.G.(2015年)。实时建模和监控单个患者。瑞士查姆施普林格,第107-136页。
[19] Friedman,N.、Linial,M.、Nachman,I.和Peer,D.(2004年)。使用贝叶斯网络分析表达式数据。J.计算。生物学7:601-620。
[20] Friedman,N.、Murphy,K.P.和Russell,S.J.(1998年)。学习动态概率网络的结构。收录:Cooper,G.F.和Moral,S.(编辑),UAI’98:第十四届人工智能不确定性会议记录。威斯康星大学商学院,美国威斯康星州麦迪逊,第139-147页。摩根·考夫曼。
[21] Gardner,T.S.、Di Bernardo,D.、Lorenz,D.和Collins,J.J.(2003)。通过表达谱推断遗传网络并识别复合作用模式。科学301:102-105,doi:10.1126/Science.1081900·doi:10.1126/science.1081900
[22] Grzegorczyk,M.和Husmeier,D.(2009年)。非静态连续动态贝叶斯网络。主题:神经信息处理系统的进展。Curran Associates,Inc.,加拿大温哥华,第682-690页。
[23] Grzegorczyk,M.和Husmeier,D.(2011年)。连续数据的非同源动态贝叶斯网络。机器。学习。83:355-419,doi:10.1007/s10994-010-5230-7·Zbl 1274.62201号 ·doi:10.1007/s10994-010-5230-7
[24] Grzegorczyk,M.和Husmeier,D.(2012年)。具有顺序耦合交互参数的非齐次动态贝叶斯网络,用于系统和合成生物学中的应用。统计应用程序。遗传学。分子生物学。11,doi:10.1515/1544-6115.1761·Zbl 1296.92039号 ·数字对象标识代码:10.1515/1544-6115.1761
[25] Halbersberg,D.和Lerner,B.(2020年)。潜在动态贝叶斯网络的本地到全球学习。In:第24届欧洲人工智能会议-ECAI 2020。IOS出版社,西班牙圣地亚哥德孔波斯特拉。
[26] Hartemink,A.J.(2005)。反向工程基因调控网络。自然生物技术。23:554-555,doi:10.1038/nbt0505-554·doi:10.1038/nbt0505-554
[27] Hastie,T.和Efron,B.(2013年)。最小角度回归,拉索和前向分段,R包1.2版。
[28] Heckerman,D.、Geiger,D.和Chickering,D.M.(1995年)。学习贝叶斯网络:知识和统计数据的结合。机器。学习。20:197-243,doi:10.1007/bf00994016·兹比尔08316.8096 ·doi:10.1007/bf00994016
[29] Hill,S.M.、Lu,Y.、Molina,J.、Heiser,L.M.、Spellman,P.T.、Speed,T.P.、Gray,J.W.、Mills,G.B.和Mukherjee,S.(2012年)。癌症细胞系中信号网络拓扑的贝叶斯推断。生物信息学28:2804-2810,doi:10.1093/Bioinformatics/bts514·doi:10.1093/bioinformatics/bts514
[30] Hurd,P.J.和Nelson,C.J.(2009年)。在表观遗传学研究中,下一代测序相对于微阵列的优势。简报功能。基因组蛋白质组学8:174-183,doi:10.1093/bfgp/elp013·doi:10.1093/bfgp/elp013
[31] Husmeier,D.、Dondelinger,F.和Lèbre,S.(2010年)。非齐次动态贝叶斯网络的跨时间段信息共享。主题:神经信息处理系统的进展。Curran Associates,Inc.,加拿大温哥华,第901-909页。
[32] Iglesias-Martinez,L.F.、Kolch,W.和Santra,T.(2016)。BGRMI:一种从时间进程基因表达数据推断基因调控网络的方法及其在乳腺癌研究中的应用。科学。代表6:37140,doi:10.1038/srep37140·doi:10.1038/srep37140
[33] Imoto,S.、Higuchi,T.、Goto,T.,Tashiro,K.、Kuhara,S.和Miyano,S.(2004)。结合微阵列和生物知识,通过贝叶斯网络估计基因网络。生物信息学杂志。计算。生物学2:77-98,doi:10.1142/s021972000400048x。 ·doi:10.1142/s021972000400048x
[34] Jassal,B.,Matthews,L.,Viteri,G.,Gong,C.,Lorente,P.,Fabregat,A.,Sidiropoulos,K.,Cook,J.,Gillespie,M.,Haw,R.等人(2019年)。反应途径知识库。核酸研究48:D498-D503。
[35] Kanehisa,M.和Goto,S.(2000年)。KEGG:京都基因和基因组百科全书。核酸研究28:27-30,doi:10.1093/nar/28.127·doi:10.1093/nar/28.1.27
[36] Kim,S.Y.、Imoto,S.和Miyano,S.(2003年)。使用动态贝叶斯网络从时间序列微阵列数据推断基因网络。生物信息简介。4:228-235,doi:10.1093/bib/4.3.228·doi:10.1093/bib/4.3228
[37] Kim,S.、Imoto,S.和Miyano,S.(2004年)。基于时间序列基因表达数据的基因网络非线性建模的动态贝叶斯网络和非参数回归。生物系统75:57-65,doi:10.1016/j.Biosystems.2004.03.004·doi:10.1016/j.biosystems.2004.03.004文件
[38] Koivisto,M.和Sood,K.(2004年)。贝叶斯网络中的精确贝叶斯结构发现。J.马赫。学习。决议5:549-573·Zbl 1222.68234号
[39] Koranda,M.、Schleiffer,A.、Endler,L.和Ammerer,G.(2000年)。叉状转录因子将ndd1招募到g2/m特异性启动子的染色质中。《自然》406:94,doi:10.1038/35017589·doi:10.1038/35017589
[40] Lähdesmäki,H.和Shmulevich,I.(2008)。从时间序列和稳态测量中学习动态贝叶斯网络的结构。机器。学习。71:185-217,doi:10.1007/s10994-008-5053-y·Zbl 1470.68127号 ·doi:10.1007/s10994-008-5053-y
[41] Lähdesmäki,H.、Shmulevich,I.和Yli-Harja,O.(2003)。布尔网络模型下的基因调控网络学习。机器。学习。52:147-167,doi:10.1023/a:1023905711304·Zbl 1039.68162号 ·doi:10.1023/a:1023905711304
[42] Lèbre,S.(2009)。具有低阶独立性的动态遗传网络推断。统计应用程序。遗传学。分子生物学。8,doi:10.202/1544-6115.1294·Zbl 1276.62080号 ·doi:10.2202/1544-6115.1294
[43] Lèbre,S.、Becq,J.、Devaux,F.、Stumpf,M.P.和Lelandais,G.(2010年)。基因调节网络时变结构的统计推断。BMC系统。生物学4:130,doi:10.1186/1752-0509-4-130·doi:10.1186/1752-0509-4-130
[44] Lébre,S.和Chiquet,J.(2012)。G1DBN:执行动态贝叶斯网络推理的包,R包3.1.1版。
[45] Lèbre,S.、Dondelinger,F.和Husmeier,D.(2012)。系统生物学中的非齐次动态贝叶斯网络。In:下一代微阵列生物信息学。斯普林格,克利夫顿,美国,第199-213页。
[46] Li,Z.、Li,P.、Krishnan,A.和Liu,J.(2011)。结合微分方程模型和局部动态贝叶斯网络分析的大规模动态基因调控网络推理。生物信息学27:2686-2691,doi:10.1093/Bioinformatics/btr454·doi:10.1093/bioinformatics/btr454
[47] Li,Y.和Ngom,A.(2013)。用于从时间序列微阵列数据中识别基因调控网络的最大-最小高阶动态贝叶斯网络学习。2013年IEEE生物信息学和计算生物学计算智能研讨会(CIBCB)。IEEE,新加坡,第83-90页。
[48] Liu,C.,Jiang,J.,Gu,J..,Yu,Z.,Wang,T.和Lu,H.(2016)。使用带有先验知识集成(SKI)的变量筛选协议进行高维组学数据分析。BMC系统。生物学10:118,doi:10.1186/s12918-016-0358-0·doi:10.1186/s12918-016-0358-0
[49] Ma,S.、Kemmeren,P.、Gresham,D.和Statnikov,A.(2014)。酿酒酵母基因组规模调控网络的去新生学习。公共科学图书馆One 9:e106479,doi:10.1371/journal.pone.0106479·doi:10.1371/journal.pone.0106479
[50] Margaritis,D.和Thrun,S.(2000年)。通过局部邻域进行贝叶斯网络归纳。In:神经信息处理系统的进展。麻省理工学院出版社,美国丹佛,第505-511页。
[51] Margolin,A.A.、Nemenman,I.、Basso,K.、Wiggins,C.、Stolovitzky,G.、Dalla Favera,R.和Califano,A.(2006年)。ARACNE:在哺乳动物细胞环境中重建基因调控网络的算法。BMC生物信息。7:S7,doi:10.1186/1471-2105-7-s1-S7·数字对象标识代码:10.1186/1471-2105-7-s1-s7
[52] Mihajlovic,V.和Petkovic,M.(2001)。《动态贝叶斯网络:最先进的技术》,荷兰恩舍德特温特大学。
[53] Murphy,K.和Mian,S.(1999)。使用动态贝叶斯网络建模基因表达数据,技术报告,技术报告。加州大学伯克利分校计算机科学部。
[54] Opgen-Rhein,R.和Strimmer,K.(2007年)。从系统生物学时间进程数据中学习因果网络:向量自回归过程的有效模型选择程序。BMC生物信息。8:S3,doi:10.1186/1471-2105-8-s2-S3·doi:10.1186/1471-2105-8-s2-s3
[55] Pearl,J.(2014)。智能系统中的概率推理:似是而非推理网络。摩根·考夫曼,美国伯灵顿。
[56] Peña,J.M.、Björkegren,J.和Tegnér,J.(2005)。通过交叉验证学习动态贝叶斯网络模型。模式识别。莱特。26:2295-2308,doi:10.1016/j.patrec.2005.04.005·doi:10.1016/j.patrec.2005.04.005
[57] Perrin,B.-E.、Ralaivola,L.、Mazurie,A.、Bottani,S.、Mallet,J.和d'Alche-Buc,F.(2003)。利用动态贝叶斯网络进行基因网络推理。生物信息学19:ii138-ii148,doi:10.1093/Bioinformatics/btg1071·doi:10.1093/bioinformatics/btg1071
[58] Pirgazi,J.和Khanteymoori,A.R.(2018年)。基于卡尔曼滤波和线性回归的稳健基因调控网络推理方法。《公共科学图书馆·综合》13:e0200094,doi:10.1371/journal.pone.0200094·doi:10.1371/journal.pone.0200094
[59] Rajapakse,J.C.和Chaturvedi,I.(2010年)。可变阶动态贝叶斯网络的基因调控网络。2010年国际神经网络联合会议(IJCNN)。IEEE,西班牙巴塞罗那,第1-5页。
[60] Robinson,J.W.和Hartemink,A.J.(2009年)。非平稳动态贝叶斯网络。主题:神经信息处理系统的进展。Curran Associates,Inc.,加拿大温哥华,第1369-1376页。
[61] Robinson,J.W.、Hartemink,A.J.和Ghahramani,Z.(2010年)。学习非平稳动态贝叶斯网络。J.马赫。学习。第11号决议·Zbl 1242.68244号
[62] Schrynemackers,M.、Küffner,R.和Geurts,P.(2013)。生物网络推理监督方法验证的协议和措施。前面。遗传学。4:262,doi:10.3389/fgene.2013.00262·doi:10.3389/fgene.2013.00262
[63] Shafiee Kamalabad,M.和Grzegorczyk,M.(2019年)。具有沿边顺序耦合参数的非同源动态贝叶斯网络。生物信息学36:1198-1207。
[64] Shermin,A.和Orgun,M.A.(2009年)。使用动态贝叶斯网络从表达谱推断基因调控网络。摘自:2009年ACM应用计算研讨会论文集。计算机机械协会,美国纽约州纽约市,美国夏威夷火奴鲁鲁,第799-803页。
[65] Shmelkov,E.、Tang,Z.、Aifantis,I.和Statnikov,A.(2011年)。在全基因组范围内评估人类转录调控途径的质量和完整性。生物。直接6:15,doi:10.1186/1745-6150-6-15·doi:10.1186/1745-6150-6-15
[66] Song,L.、Kolar,M.和Xing,E.P.(2009年)。时变动态贝叶斯网络。主题:神经信息处理系统的进展。Curran Associates,Inc.,加拿大温哥华,第1732-1740页。
[67] Spellman,P.T.、Sherlock,G.、Zhang,M.Q.、Iyer,V.R.、Anders,K.、Eisen,M.B.、Brown,P.O.、Botstein,D.和Futcher,B.(1998)。利用微阵列杂交技术对酿酒酵母细胞周期调控基因的综合鉴定。分子生物学。单元格9:3273-3297,doi:10.1091/mbc.9.12.3273·doi:10.1091/mbc.9.12.3273
[68] Tastan,O.、Qi,Y.、Carbonell,J.G.和Klein-Seetharaman,J.(2009)。通过信息整合预测hiv-1和人类蛋白质之间的相互作用。摘自:生物计算2009。《世界科学》,美国夏威夷,第516-527页。
[69] Teixeira,M.C.、Monteiro,P.、Jain,P.,Tenreiro,S.、Fernandes,A.R.、Mira,N.P.、Alenquer,M.、Freitas,A.T.、Oliveira,A.L.和Sa-Correia,I.(2006年)。YEASTRACT数据库:酿酒酵母转录调控关联分析工具。核酸研究34:D446-D451,doi:10.1093/nar/gkj013·doi:10.1093/nar/gkj013
[70] Tibshirani,R.(1996)。通过套索进行回归收缩和选择。J.罗伊。Stat.Soc.B 58:267-288,doi:10.1111/j.2517-6161.1996.tb02080.x·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[71] 蔡明杰、王建荣、何顺杰、舒立生、黄伟立和何顺云(2020)。GREMA:利用基于进化智能的置信水平对模拟基因调控网络进行建模,以应对未定问题。生物信息学36:3833-840,doi:10.1109/icce-taiwan49838.2020.9258351·doi:10.1109/icce-taiwan49838.2020.9258351
[72] Tucker,A.、Liu,X.和Ogden-Swift,A.(2001)。大时滞动态概率模型的进化学习。《国际情报杂志》。系统。16:621-645,doi:10.1002/int.1027·Zbl 0979.68083号 ·doi:10.1002/int.1027
[73] Vinh,N.X.、Chetty,M.、Coppel,R.和Wangikar,P.P.(2011年)。GlobalMIT:使用互信息测试准则学习全局最优动态贝叶斯网络。生物信息学27:2765-2766,doi:10.1093/Bioinformatics/btr457·doi:10.1093/bioinformatics/btr457
[74] Vinh,N.X.、Chetty,M.、Coppel,R.和Wangikar,P.P.(2012a)。通过高阶动态贝叶斯网络全局优化的基因调控网络建模。BMC Bioinf。13: 131.
[75] Vinh,N.X.、Chetty,M.、Coppel,R.和Wangikar,P.P.(2012b)。用于学习动态贝叶斯网络的局部和全局算法。2012年IEEE第12届数据挖掘国际会议。IEEE,布鲁塞尔,第685-694页。
[76] Vohradsky,J.(2001)。基因表达的神经网络模型。法赛布。J.15:846-854,doi:10.1096/fj.00-0361com。 ·网址:10.1096/fj.00-0361com
[77] Wexler,E.M.、Rosen,E.、Lu,D.、Osborn,G.E.、Martin,E.、Raybould,H.和Geschwind,D.H.(2011)。Wnt1调节的转录网络的全基因组分析暗示神经退行性途径。科学。信号。4:ra65-ra65,doi:10.1126/scisional.2002282·doi:10.1126/scisional.2002282
[78] Wille,A.和Bühlmann,P.(2006)。用于推断遗传网络的低阶条件独立图。统计应用程序。遗传学。分子生物学。5,doi:10.2202/1544-6115.1170·Zbl 1166.62374号 ·doi:10.202/1544-6115.1170
[79] Xing,L.、Guo,M.、Liu,X.、Wang,C.和Zhang,L.(2018)。利用洪水修剪爬山算法重建基因调控网络。基因9:342,doi:10.3390/genes9070342·doi:10.3390/genes9070342
[80] Xing,Z.和Wu,D.(2006)。使用动态贝叶斯网络建模多时间单位延迟基因调控网络。In:第六届IEEE数据挖掘工厂国际会议(ICDMW'06)。IEEE,香港,第190-195页。
[81] Xu,C.和Jackson,S.A.(2019年)。机器学习和复杂生物数据。基因组生物学。20,doi:10.1186/s13059-019-1689-0·doi:10.1186/s13059-019-1689-0
[82] Zhang,Y.、Deng,Z.、Jiang,H.和Jia,P.(2006)。具有结构期望最大化(SEM)的动态贝叶斯网络(DBN),用于根据时间序列基因表达数据对基因网络进行建模。输入:BIOCOMP。美国拉斯维加斯CSREA出版社,第41-47页。
[83] Zhang,Y.、Deng,Z.、Jiang,H.和Jia,P.(2007)。通过具有结构EM的动态贝叶斯网络从多个数据源推断基因调控网络。In:Cohen Boulakia,S.和Tannen,V.(编辑),生命科学中的数据整合,第204-214页。施普林格-柏林-海德堡,柏林,海德堡。
[84] Zou,M.和Conzen,S.D.(2004年)。一种新的动态贝叶斯网络(DBN)方法,用于从时间进程微阵列数据中识别基因调控网络。生物信息学21:71-79,doi:10.1093/Bioinformatics/bth463·doi:10.1093/bioinformatics/bth463
[85] Zuo,Y.、Yu,G.、Tadesse,M.G.和Ressom,H.W.(2014)。利用低阶偏相关进行生物网络推理。方法69:266-273,doi:10.1016/j.meth.2014.06.010·doi:10.1016/j.meth.2014.06.010
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。