×

网络推理和生物动力学。 (英语) Zbl 1257.62108号

综述:网络推理方法目前广泛应用于生物应用中,以探测基因或蛋白质等分子组分之间的调控关系。针对这种情况提出了许多方法,但其统计公式之间的联系和差异没有得到足够的重视。我们展示了如何根据线性模型的变量选择来描述一类广泛的统计网络推理方法,包括许多现有方法。这揭示了这些方法之间一些微妙但重要的差异,包括离散观测数据中时间间隔的处理。
在开发一个通用公式时,我们还探讨了单细胞随机动力学和细胞上平均值的网络推理之间的关系。这澄清了生物化学网络在细胞水平上运行时与网络推断之间的联系,网络推断是在细胞群体的平均数据上进行的。我们使用两个已发布的动力学模型,比较了32种网络推理方法的实证结果,这些方法是我们描述的一般公式的实例。我们的研究揭示了网络推理的适用性和局限性,并为实践者提供了指导和实验设计建议。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92立方厘米 系统生物学、网络
92C40型 生物化学、分子生物学
62M45型 神经网络及从随机过程推断的相关方法
62J05型 线性回归;混合模型

关键词:

变量选择
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Éijö,T.和Lähdesmäki,H.(2009年)。使用非参数分子动力学从基因表达测量中学习基因调控网络。生物信息学25 2937-2944。
[2] 阿勒泰·G和埃默特·斯特里布·F(2010)。通过集成方法揭示基因网络推理算法在网络层次上的差异。生物信息学26 1738-1744。
[3] Babu,M.M.、Luscombe,N.M.、Aravind,L.、Gerstein,M.和Teichmann,S.A.(2004年)。转录调控网络的结构和演变。货币。操作。结构。生物学14 283-291。
[4] Bansal,M.、Belcastro,V.和Ambesi-Impiombato,A.(2007年)。如何从表达谱推断基因网络。摩尔系统。生物3第78条。
[5] Bansal,M.和di Bernardo,D.(2007年)。从时间基因表达谱推断基因网络。IET系统。生物学1 306-312。
[6] Beal,M.J.、Falciani,F.、Ghahramani,Z.、Rangel,C.和Wild,D.L.(2005)。用贝叶斯方法重建含有隐藏因子的基因调控网络。生物信息学21 349-356。
[7] Bolstad,A.、Van Veen,B.D.和Nowak,R.(2011年)。基于群稀疏正则化的因果网络推理。IEEE传输。信号处理。59 2628-2641. ·Zbl 1392.94012号 ·doi:10.1109/TSP.2011.229515
[8] Bonneau,R.(2008)。学习生物网络:从模块到动力学。自然化学。生物编号4 658-664。
[9] Burnham,K.P.和Anderson,D.R.(2002年)。模型选择和多模型推理:实用信息理论方法,第二版,Springer,纽约·Zbl 1005.62007号 ·数字对象标识代码:10.1007/b97636
[10] Camacho,D.M.和Collins,J.J.(2009年)。系统生物学一鸣惊人。单元格137 24-26·Zbl 1241.93026号 ·doi:10.1002/acs.987
[11] Cantone,I.、Marucci,L.、Iorio,F.、Ricci,M.A.、Belcastro,V.、Bansal,M.、Santini,S.、di Bernardo,M.和Cosma,M.P.(2009年)。一个酵母合成网络,用于反向工程和建模方法的体内评估。137号细胞172-181。
[12] Craciun,G.和Pantea,C.(2008)。化学反应网络的可识别性。数学杂志。化学。44 244-259. ·Zbl 1145.92040号 ·数字对象标识代码:10.1007/s10910-007-9307-x
[13] Dargatz,C.(2010年)。扩散过程的贝叶斯推理及其在生命科学中的应用。慕尼黑博士论文。
[14] Davidson,E.H.(2001)。基因调控系统。发展与演变。圣地亚哥学术出版社。
[15] Deltell,A.(2011)。变量选择的客观贝叶斯准则。巴伦西亚大学博士论文。
[16] Eaton,D.和Murphy,K.(2007年)。从不确定干预中学习精确的贝叶斯结构。2007年3月21日至24日在波多黎各圣胡安举行的第11届人工智能和统计会议记录。机器学习研究杂志,研讨会和会议记录,第2卷:AISTATS 2007 107-114。
[17] Ellis,B.和Wong,W.H.(2008)。从实验数据中学习因果贝叶斯网络结构。J.Amer。统计师。协会103 778-789·Zbl 1471.62056号 ·doi:10.1198/0162145000000193
[18] Elowitz,M.B.、Levine,A.J.和Siggia,E.D.(2002年)。单个细胞中的随机基因表达。科学297 1129-1131。
[19] Fawcett,T.(2005)。ROC分析简介。模式识别字母27 861-874。
[20] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。用图形套索进行稀疏逆协方差估计。生物统计学9 432-441·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[21] Friedman,J.和Koller,D.(2003)。关于网络结构的贝叶斯分析。贝叶斯网络中结构发现的贝叶斯方法。机器。学习。50 95-125. ·Zbl 1033.68104号 ·doi:10.1023/A:1020249912095
[22] Friedman,N.、Linial,M.和Nachman,I.等人(2000年)。使用贝叶斯网络来分析表达式数据。J.公司。生物信息7 601-620。
[23] Grzegorczyk,M.和Husmeier,D.(2011年)。改进时变基因调控网络的重建:通过基因间信息共享进行动态规划和调控。生物信息学27 693-699。
[24] Hache,H.、Lehrach,H和Herwig,R.(2009年)。基因调控网络的逆向工程:一项比较研究。EURASIP J.生物信息。系统。生物.617281。
[25] Hans,C.、Dobra,A.和West,M.(2007年)。霰弹枪随机搜索“大”回归。J.Amer。统计师。协会102 507-516·Zbl 1134.62398号 ·doi:10.1198/0162145000000121
[26] Hecker,M.、Lambeck,S.、Toepfer,S.,van Someren,E.和Guthke,R.(2009年)。基因调控网络推断:动态模型中的数据整合——综述。生物系统96 86-103。
[27] Hill,S.、Lu,Y.和Molina,J.(2011)。单一癌症中信号网络拓扑的贝叶斯推断。未发表的手稿。
[28] Hurn,A.、Jeisman,J.和Lindsay,K.(2007年)。以牙还牙:随机微分方程参数估计方法的关键评估。《金融计量经济学杂志》5 390。
[29] Ideker,T.和Lauffenburger,D.(2003)。用脚手架建造:从高到低级别细胞建模的新兴策略。生物技术趋势21 255-262。
[30] Kim,S.Y.、Imoto,S.和Miyano,S.(2003)。使用动态贝叶斯网络从时间序列微阵列数据推断基因网络。生物信息学简介4 228-235·Zbl 1112.92322号
[31] Knowles,D.和Ghahramani,Z.(2011年)。非参数贝叶斯稀疏因子模型及其在基因表达建模中的应用。附录申请。统计数字5 1534-1552·Zbl 1223.62013年 ·doi:10.1214/10-AOAS435
[32] Kolar,M.、Song,L.和Xing,E.P.(2009年)。具有结构变化的变系数模型的稀疏学习。NIPS 22 1006-1014。
[33] Kou,S.C.、Xie,X.S.和Liu,J.S.(2005)。单分子实验数据的贝叶斯分析。J.罗伊。统计师。Soc.序列号。C 54 469-506·Zbl 1490.62346号 ·数字对象标识代码:10.1111/j.1467-9876.200500509.x
[34] Lèbre,S.、Becq,J.和Devaux,F.等人(2010年)。基因调控网络时变结构的统计推断。BMC系统生物学4 130。
[35] Lee,W.-P.和Tzou,W.S.(2009)。从表达数据中发现基因网络的计算方法。简介。生物信息学10 408-423。
[36] Li,C.W.和Chen,B.S.(2010年)。识别基因和蛋白质调节网络的功能机制,以应对更广泛的环境压力。公司。和Func。基因组学408705。
[37] Li,Z.、Li,P.、Krishnan,A.和Liu,J.(2011)。结合微分方程模型和局部动态贝叶斯网络分析的大规模动态基因调控网络推理。生物信息学27 2686-2691·Zbl 1022.68519号
[38] Marbach,D.、Schaffter,T.、Mattiussi,C.和Floreano,D.(2009年)。为逆向工程方法的性能评估生成真实的硅基因网络。J.计算。生物学16 229-239。
[39] Markowetz,F.和Spang,R.(2007年)。推断蜂窝网络——综述。BMC生物信息学8(补遗6)S5。
[40] McAdams,H.H.和Arkin,A.(1997)。基因表达的随机机制。PNAS 94 814-819。
[41] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。安。统计师。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[42] Minty,J.J.、Varedi,K.S.M.和Nina,L.X.(2009年)。网络基准测试:系统和合成生物学之间的幸福结合。化学与生物学16 239-241。
[43] Morrissey,E.R.、Juárez,M.A.、Denby,K.J.和Burroughs,N.J.(2010年)。利用具有重复测量的时间进程数据对基因相互作用网络进行逆向工程。生物信息学26 2305-2312。
[44] Mukherjee,S.和Speed,T.P.(2008)。使用信息先验进行网络推理。PNAS 105 14313-14318。
[45] Nam,D.、Yoon,S.H.和Kim,J.F.(2007年)。从时间序列表达数据中集成学习遗传网络。生物信息学23 3225-3231。
[46] Oates,C.J.和Mukherjee,S.(2011年)。补充“网络推理和生物动力学”·Zbl 1257.62108号
[47] Øksendal,B.(1998)。随机微分方程:应用简介,第5版,施普林格出版社,柏林·Zbl 0897.60056号
[48] Opgen-Rhein,R.和Strimmer,K.(2007年)。从系统生物学时程数据学习因果网络:向量自回归过程的有效模型选择过程。BMC生物信息学8(补遗2)S3·兹比尔1158.92311
[49] Paulsson,J.(2005)。随机基因表达模型。生命物理学评论2 157-175。
[50] Pearl,J.(2009)。统计学中的因果推理:概述。统计调查。3 96-146. ·Zbl 1300.62013年 ·doi:10.1214/09-SS057
[51] Prill,R.J.、Marbach,D.、Saez-Rodriguez,J.、Sorger,P.K.、Alexopoulos,L.G.、Xue,X.、Clarke,N.D.、Altan-Bonnet,G.和Stolovitzky,G.(2010)。对系统生物学模型进行严格评估:DREAM3挑战。公共科学图书馆ONE 5 e9202。
[52] Rogers,S.、Khanin,R.和Girolma,M.(2007年)。基于贝叶斯模型的转录因子活性推断。BMC生物信息学8(补遗2)S2。
[53] Schoeberl,B.、Eichler-Jonsson,C.、Gilles,E.D.和Müller,G.(2002)。由表面和内部化EGF受体激活的MAP激酶级联动力学的计算模型。自然生物技术。20 370-375.
[54] Smith,V.A.、Jarvis,E.D.和Hartemink,A.J.(2002)。使用复杂生物系统的模拟评估功能网络推理。生物信息学18 S216-S224·Zbl 1177.62126号 ·网址:10.1080/03610920902898472
[55] Swain,P.S.、Elowitz,M.B.和Siggia,E.D.(2002)。基因表达随机性的内在和外在贡献。PNAS 99 12795-12800。
[56] Swat,M.、Kel,A.和Herzel,H.(2004)。哺乳动物G({1}/\)S跃迁调控模块的分叉分析。生物信息学20 1506-1511。
[57] Van den Bulcke,T.、Van Leemput,K.、Naudts,B.、Van Remortel,P.、Ma,H.、Verschoren,A.、Moor,B.D.和Marchal,K.(2006年)。SynTReN:用于设计和分析结构学习算法的合成基因表达数据生成器。BMC生物信息学7 43。
[58] Van Kampen,N.G.(2007年)。物理和化学中的随机过程,第三版,荷兰北部,阿姆斯特丹·Zbl 0511.60038号
[59] Werhli,A.V.、Grzegorczyk,M.和Husmeier,D.(2006年)。逆向工程基因调控网络与关联网络、图形高斯模型和贝叶斯网络的比较评估。生物信息学22 2523-2531。
[60] Wilkinson,D.J.(2006)。系统生物学随机建模。查普曼和霍尔/CRC,佛罗里达州博卡拉顿·Zbl 1099.92004号
[61] Wilkinson,D.J.(2009)。异质生物系统定量描述的随机建模。《自然评论遗传学》10 122-133。
[62] Xu,T.-R,Vyshemersky,V.,Gormand,A.,von Kriegsheim,A.,Girolama,M.,Baillie,G.S.,Ketley,D.,Dunlop,A.J.,Milligan,G.,Houslay,M.D.和Kolch,W.(2010年)。从特定生物化学物种的多重扰动测量推断信号通路拓扑。科学。信号。3 ra20。
[63] Yarden,Y.和Sliwkowski,M.X.(2001)。解开ErbB信号网络。Nat.Rev.Mol.Cell Biol。2 127-137.
[64] Zellner,A.(1986年)。关于评估先验分布和使用(g)-先验分布的贝叶斯回归分析。贝叶斯推理和决策技术。贝叶斯计量经济学统计研究。6 233-243. 荷兰北部,阿姆斯特丹·Zbl 0655.62071号
[65] 邹,C.和冯,J.(2009)。格兰杰因果关系与动态贝叶斯网络推理:一项比较研究。BMC生物信息学10 12。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。