×

昼夜节律调控网络的统计推断。 (英语) Zbl 1296.92011号

摘要:我们评估了各种最先进的统计和机器学习方法在生物节律调控背景下重建基因和蛋白质调控网络的准确性。我们的研究利用了基因表达和蛋白质浓度时间序列对关键昼夜节律钟成分的日益可用性拟南芥此外,基因表达和蛋白质浓度时间序列是根据最近公布的生物钟调节网络模拟的拟南芥在该模型中,蛋白质和基因的相互作用由基于迈克利斯·曼顿动力学的马尔可夫跳跃过程描述。我们密切遵循最近的实验方案,包括将幼苗带入不同的光暗周期,以及敲除各种关键调控基因。我们的研究为关键的比较性能评估提供了相对网络重建准确度分数,并揭示了一系列高度相关的问题:它量化了与未知蛋白质浓度和mRNA转录率相关的系统缺失值的影响,它研究了性能对网络拓扑和重现度的依赖性,深入了解了非线性方法何时以及为什么不能优于线性方法,它提供了不同推理过程中参数设置的改进指南,它还提出了关于中枢昼夜节律基因调控网络结构的新假设拟南芥.

MSC公司:

92B15号机组 普通生物统计学
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Ahmed,A.和E.P.Xing(2009):“恢复社会和生物研究中依赖性的时变网络”,Proc。国家。阿卡德。科学。,106、11878-11883页。;
[2] ijö,T.和H.Lähdesmäki(2009):“利用非参数分子动力学从基因表达测量中学习基因调控网络”,生物信息学,25,2937-2944。;
[3] Andrieu,C.和A.Doucet(1999):“通过可逆跳跃MCMC联合贝叶斯模型选择和噪声正弦估计”,IEEE T信号程序。,47, 2667-2676.;
[4] Barenco,M.、D.Tomescu、D.Brewer、R.Callard、J.Stark和M.Hubank(2006):“使用隐藏变量动态模型对p53靶点进行排名预测”,《基因组生物学》,第7期,第25页。;
[5] Beal,M.、F.Falciani、Z.Ghahramani、C.Rangel和D.Wild(2005):“利用隐藏因子重建遗传调控网络的贝叶斯方法”,生物信息学,21,349-356。;
[6] Beal,M.(2003):《近似贝叶斯推断的变分算法》,英国伦敦大学学院盖茨比计算神经科学部博士论文。;
[7] Bengtsson,M.、M.Hemberg、P.Rorsman和A.Stáhlberg(2008):“单个细胞中mRNA的量化和RT-qPCR诱导噪声的建模”,BMC分子生物学,9,63。;
[8] Bishop,C.M.(2006):模式识别和机器学习,新加坡:Springer·兹比尔1107.68072
[9] Brandt,S.(1999):《数据分析:科学家和工程师的统计和计算方法》,美国纽约:斯普林格出版社·Zbl 0983.62001号
[10] Brooks,S.和A.Gelman(1999):“监测迭代模拟收敛性的通用方法”,J.Compute。图表。统计,7434-455。;
[11] Butte,A.J.和I.S.Kohane(2000):“相互信息相关网络:使用两两熵测量的功能基因组聚类”,《太平洋生物计算研讨会》,第5卷,418-429。;
[12] Ciocchetta,F.和J.Hillston(2009):“生物-PEPA:生物系统建模和分析框架”,Theor。计算。科学。,410, 3065-3084.; ·Zbl 1173.68041号
[13] Davies,J.和M.Goadrich(2006):“精确重算和ROC曲线之间的关系”,《第23届机器学习国际会议论文集》,233-240。;
[14] Edwards,K.,O.Akman,K.Knox,P.Lumsden,A.Thomson,P.Brown,A.Pokhilko,L.Kozma-Bognar,F.Nagy,D.Rand,A.J.Millar。(2010):《环境条件变化下监管灵活性的定量分析》,Mol.Syst。生物学,6424。;
[15] Feugier,F.和A.Satake(2012):“昼夜节律钟和蔗糖可用性之间的动态反馈解释了淀粉代谢对不同光周期的适应性反应,”Front。植物科学。,三。;
[16] Friedman,J.、T.Hastie和R.Tibshirani(2008):“用图形Lasso进行稀疏逆协方差估计”,《生物统计学》,第9期,第432-441页·Zbl 1143.62076号
[17] Friedman,J.,T.Hastie和R.Tibshirani(2010):“通过坐标下降的广义线性模型的正则化路径”,J.Stat.Softw。,33, 1-22.;
[18] Friedman,N.、M.Linial、I.Nachman和D.Peere(2000):“使用贝叶斯网络分析表达数据”,J.Compute。生物学,7601-620。;
[19] Geiger,D.和D.Heckerman(1994):“学习高斯网络”,载于国际人工智能不确定性会议,华盛顿州西雅图:Morgan Kaufmann出版社,235-243。;
[20] Gelman,A.和D.Rubin(1992):“使用多序列的迭代模拟推断”,《统计科学》。,7, 457-472.; ·Zbl 1386.65060号
[21] Gillespie,D.(1977):“耦合化学反应的精确随机模拟”,J.Phys。化学。,81, 2340-2361.;
[22] Grzegorczyk,M.和D.Husmeier(2012):“系统和合成生物学应用中具有顺序耦合交互参数的非齐次动态贝叶斯网络”,《统计应用》。基因。分子生物学。(SAGMB),第11条,第7条·Zbl 1296.92039号
[23] Grzegorczyk,M.和D.Husmeier(2013):“基于分层贝叶斯模型的全局信息耦合非齐次动态贝叶斯网络的正则化”,马赫。学习。,91,1-50·Zbl 1273.68378号
[24] Guerriero,M.、A.Pokhilko、A.Fernández、K.Halliday、A.Millar和J.Hillston(2012):“植物生物钟的随机特性”,J.R.Soc.Interface,9744-756。;
[25] Hanley,J.A.和B.J.McNeil(1982):“接收器工作特性(ROC)曲线下面积的含义和使用”,《放射学》,143,29-36。;
[26] Hastie,T.、R.Tibshirani和J.J.H.Friedman(2001):《统计学习的要素》,第1卷,纽约:施普林格出版社·Zbl 0973.62007号
[27] Herrero,E.,E.Kolmos,N.Bujdoso,Y.Yuan,M.Wang,M.C.Berns,H.Uhlworm,G.Coupland,R.Saini,M.Jaskolski,A.Webb,J.Gonçalves,S.J.Davis。(2012):《早花》,《植物细胞》,24428-443。;
[28] Husmeier,D.(1999):条件概率估计的神经网络:超越点预测的预测,神经计算的观点,伦敦:Springer。;
[29] Husmeier,D.(2003):“利用动态贝叶斯网络从微阵列实验推断遗传调控相互作用的敏感性和特异性”,生物信息学,192271-2282。;
[30] Kalaitzis,A.A.、A.Honkela,P.Gao和N.D.Lawrence(2013):gptk:高斯过程工具包,URL,R包版本1.06。;
[31] Ko,Y.,C.Zhai和S.Rodriguez-Zas(2007):“使用高斯混合模型推断基因路径”,生物信息学和生物医学国际会议,加利福尼亚州弗里蒙特,362-367。;
[32] Ko,Y.,C.Zhai和S.Rodriguez-Zas(2009):“使用混合贝叶斯网络推断基因路径”,BMC系统。生物学,3,54。;
[33] Kolmos,E.、M.Nowak、M.Werner、K.Fischer、G.Schwarz、S.Mathews、H.Schoof、F.Nagy、J.M.Bujnicki和S.J.Davis(2009):“通过结合结构和功能研究将ELF4整合到昼夜节律系统”,HFSP J,3,350-366。;
[34] Lawrence,N.D.、M.Girolma、M.Rattray和G.Sanguinetti(2010):《计算系统生物学中的学习和推理》,马萨诸塞州剑桥:麻省理工学院剑桥出版社·Zbl 1196.92018号
[35] Lèbre,S.、J.Becq、F.Devaux、G.Lelandais和M.Stumpf(2010):“基因调节网络时变结构的统计推断”,BMC系统。生物,4。;
[36] Locke,J.C.W.、M.M.Southern、L.Kozma-Bognár、V.Hibbert、P.E.Brown、M.S.Turner和A.J.Millar(2005):“通过迭代实验和数学分析扩展遗传网络模型”,分子系统。生物,1。;
[37] Locke,J.C.W.,L.Kozma-Bognár,P.D.Gould,B.Fehér,E.Kevei,F.Nagy,M.S.Turner,A.Hall和A.J.Millar(2006):“拟南芥多振荡器时钟中预测反馈回路的实验验证”,分子系统。生物,2。;
[38] 麦凯·D·J(1992):“贝叶斯插值”,神经计算。,4, 415-447.;
[39] Margolin,A.A.、I.Nemenman、K.Basso、C.Wiggins、G.Stolovitzky、R.Dalla-Favera和A.Caliano(2006):“ARACNE:哺乳动物细胞环境中基因调控网络重建的算法”,BMC生物信息学,7。;
[40] Marin,J.-M.和C.P.Robert(2007):《贝叶斯核心:计算贝叶斯统计的实用方法》,美国纽约:施普林格出版社·Zbl 1137.62013年
[41] Meyer,P.E.,F.Lafitte和G.Bontempi(2008):“minet:使用相互信息推断大型转录网络的R/生物导体包”,BMC生物信息学,9。;
[42] Morrissey,E.R.、M.A.Juárez、K.J.Denby和N.J.Burroughs(2011):“利用完全贝叶斯样条自回归推断非线性稀疏基因调控网络的时不变拓扑”,《生物统计学》,第12682-694页·兹比尔1314.62244
[43] Murphy,K.P.(2012):《机器学习:概率观点》,马萨诸塞州剑桥:麻省理工学院出版社·Zbl 1295.68003号
[44] Nabney,I.(2002):NETLAB:模式识别算法,Springer·Zbl 1011.68116号
[45] Neuneier,R.、F.Hergert、W.Finnoff和D.Ormoneit(1994):“条件密度估计:神经网络方法的比较”,台湾国立成工大学人工神经网络国际会议:Springer,689-692。;
[46] Opgen-Rhein,R.和K.Strimmer(2007):“从相关性到因果网络:简单近似学习算法及其在高维植物基因表达数据中的应用”,BMC系统。生物,1·Zbl 1166.62361号
[47] Pokhilko,A.、A.Fernández、K.Edwards、M.Southern、K.Halliday和A.Millar(2012):“拟南芥的时钟基因回路包括一个带有额外反馈回路的阻遏物”,分子系统。生物学,8574。;
[48] Pokhilko,A.、S.Hodge、K.Stratford、K.Knox、K.Edwards、A.Thomson、T.Mizuno和A.Millar(2010):“数据同化限制了复杂的真核生物昼夜节律模型中的新连接和组件”,分子系统。生物,6。;
[49] Pokhilko,A.,P.Mas,A.J.Millar,et al.(2013):“TOC1信号对植物昼夜节律钟及其输出的广泛影响建模”,BMC系统。生物学,7,1-12。;
[50] Rasmussen,C.E.,R.M.Neal,G.E.Hinton,D.van Camp,M.Revow,Z.Ghahramani,R.Kustra和R.Tibshirani(1996):“DELVE手册”,网址:。;
[51] Rasmussen,C.E.(1996):《高斯过程和其他非线性回归方法的评估》,Citeser博士论文。;
[52] Rasmussen,C.和C.Williams(2006):机器学习的高斯过程,第1卷,马萨诸塞州:麻省理工学院出版社剑桥·Zbl 1177.68165号
[53] Rogers,S.和M.Girolama(2005):“从基因表达数据推断调控网络的贝叶斯回归方法”,生物信息学,21,3131-3137。;
[54] Schäfer,J.和K.Strimmer(2005):“大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响”,Stat.Appl。基因。分子生物学。,4.;
[55] Smith,M.和R.Kohn(1996):“使用贝叶斯变量选择的非参数回归”,《计量经济学杂志》,75,317-343·Zbl 0864.62025号
[56] Solak,E.、R.Murray-Smith、W.E.Leithead、D.J.Leith和C.E.Rasmussen(2002):“动态系统高斯过程模型中的导数观测”,《神经信息处理系统进展》,麻省理工学院出版社:加拿大温哥华,1033-1040。;
[57] Tibshirani,R.(1995):“通过拉索进行回归收缩和选择”,J.R.Stat.Soc.系列B,58,267-288·Zbl 0850.62538号
[58] TiMet(2014):“TiMet项目——将时钟与新陈代谢联系起来:URL<ext-link ext-link-type=“uri”xlink.href=”http://timing-metabolism.eu”>http://timing-metabolism.eu。;
[59] Tipping,M.和A.Faul(2003):“稀疏贝叶斯模型的快速边际似然最大化”,《第九届人工智能与统计国际研讨会论文集》,佛罗里达州基韦斯特,1,3-6。;
[60] Tipping,M.(2001):“备用贝叶斯学习和相关向量机”,《机器学习研究杂志》,1211-244·Zbl 0997.68109号
[61] Vyshemirsky,V.和M.Girolma(2008):“生物化学系统模型的贝叶斯排名”,生物信息学,24833-839。;
[62] Weirauch,M.T.,A.Cote,R.Norel,M.Annala,Y.Zhao,T.R.Riley,J.Saez-Rodriguez,T.Cokelaer,A.Vedenko,S.Talukder,DREAM5 Consortium,Bussemaker,H.J.,Morris,Q.D.,Bulyk,M.L.,Stolvitzky,G,and T.R Hughes(2013):“转录因子序列特异性建模方法的评估”,国家生物技术。,31, 126-134.;
[63] Werhli,A.V.、M.Grzegorczyk和D.Husmeier(2006):“反向工程基因调控网络与相关网络、图形高斯模型和贝叶斯网络的比较评估”,生物信息学,22,2523-2531。;
[64] Wilkinson,D.J.(2009):“异质生物系统定量描述的随机建模”,《自然评论遗传学》。,第10112-133段。;
[65] Wilkinson,D.(2011):《系统生物学随机建模》,第44卷,Taylor&Francis,Boca Raton,FL:CRC出版社。;
[66] Zoppoli,P.、S.Morganella和M.Ceccarelli(2010年):“时间延迟-ARACNE:通过ab信息理论方法从时间过程数据对基因网络进行反向工程”,BMC生物信息学,11。;
[67] Zou,H.和T.Hastie(2005):“通过弹性网的正则化和变量选择”,J.R.Stat.Soc.系列B,67,301-320·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。