×

计算生物学中用于参数估计和模型选择的分布匹配方法。 (英语) Zbl 1258.93111号

摘要:模型参数的确定是生物系统计算建模中的一个核心挑战。通常,只有一小部分参数(如动力学速率常数)是通过实验测量的,而其余参数则是拟合的。拟合过程通常基于观测值的实验时间过程测量,用于分配参数值,以最小化这些测量值与相应模型预测之间的误差。来自实时聚合酶链反应(PCR)、酶反应、流式细胞仪等的数据往往非常嘈杂,但噪声的统计数据通常可以通过执行校准程序推断出来。本文中,我们展示了如何利用噪声特性的知识(以其累积分布函数表示)来验证或使上游状态观测器(粒子滤波器)提供的估计无效,并在结果不令人满意时对其进行改进。此外,我们还展示了如何使用相同的工具来区分同一生物过程的不同模型。我们在一个简单的基因表达模型上演示了这些思想,并且我们展示了所提出的方法如何能够处理经典技术(如最小二乘估计)无法有效解决的估计问题。

MSC公司:

93E12号机组 随机控制理论中的辨识
93E10型 随机控制理论中的估计与检测
93E11号机组 随机控制理论中的滤波
93立方厘米 由常微分方程控制的控制/观测系统
93立方厘米10 控制理论中的非线性系统
92立方厘米 系统生物学、网络

软件:

GSL公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 英格拉姆,《网络基序:结构并不决定功能》,BMC Genomics 7(1),第108页–(2006)
[2] Mayo,基因顺调控输入功能的可塑性,《公共科学图书馆·生物学》4(4)第555页–(2006)
[3] 孟德斯,《生物化学途径的非线性优化:代谢工程和参数估计的应用》,生物信息学14(10),第869页–(1998)
[4] 柯克帕特里克,《模拟退火优化》,《科学》220(4598)第671页–(1983)·兹比尔1225.90162
[5] Srinivas,《遗传算法:一项调查》,《计算机》27(6),第17页–(1994)
[6] Ashyraliyev,应用于果蝇缝隙基因回路的参数估计和可确定性分析,BMC系统生物学2(1),第83–(2008)页
[7] 鼹鼠,《生化途径中的参数估计:全局优化方法的比较》,《基因组研究》13第2467页–(2003)
[8] 穆勒,《信号通路中的自行车测试》,《皇家统计学会杂志:C辑(应用统计学)》53(4),第557页–(2004)
[9] Bortz,HIV感染动力学的模型选择和混合效应建模,《数学生物学》第68(8)页,2005-2006年·Zbl 1296.92123号
[10] 威尔金森,生物信息学和计算系统生物学中的贝叶斯方法,《生物信息学简报》8(2),第109页–(2007)
[11] 麦克亚当斯,这是一个吵闹的生意!纳米尺度的遗传调控,《遗传学趋势》15(2)第65页–(1999)
[12] Toni,动力学系统中参数推断和模型选择的近似贝叶斯计算方案,《皇家学会界面杂志》6(31),第187–(2009)页
[13] 布鲁克斯,马尔可夫链蒙特卡罗方法及其应用,皇家统计学会杂志,D辑(统计学家)47(1),第69页–(1998)
[14] Brown,具有许多未知参数的模型的统计力学方法,物理评论E 68(2)第021904-1-9页–(2003)
[15] Battogtokh,一种识别调节回路的集成方法,特别是参考粗糙脉孢菌qa基因簇,《美国国家科学院院刊》99(26)第16904页–(2002)
[16] Sisson,《无可能性序贯蒙特卡罗》,美国国家科学院院刊104(6),第1760页–(2007)·Zbl 1160.65005号
[17] Hulhoven,生物过程状态估计的混合扩展Luenberger渐近观测器,化学工程科学61(21)pp 7151–(2006)
[18] Quach,基于ODE的生物网络推断非线性状态空间模型中参数和隐藏变量的估计,生物信息学23(23)pp 3209–(2007)
[19] Sun,生化网络非线性状态空间模型参数估计的扩展卡尔曼滤波器,PLoS ONE 3(11)pp e3758-1-13–(2008)
[20] Wang,通过短基因表达时间序列建模非线性动态基因调控网络的扩展卡尔曼滤波方法,IEEE/ACM计算生物学和生物信息学汇刊6(3),第410–(2009)页
[21] Bullinger E Allgower F非线性系统的自适应高增益观测器第36届IEEE决策与控制会议(CDC97)5 1997 4348 4353 10.1109/CDC.1997.649541
[22] Farina M Findeisen R Bullinger E Bittanti S Allgower F Wellstead P生化反应网络可识别性结果第45届IEEE决策与控制会议(CDC06)2006 2104 2109 10.1109/CDC.2006.376925
[23] 模型扩展促进了使用非线性观测器对动力学反应模型中Fey D Findeisen R Bullinger E参数的估计第17届IFAC 2008年世界大会10.3182/20080706-5-KR-1001.00053
[24] Munsky,《倾听噪音:随机波动揭示基因网络参数》,Mol Syst Biol 5(2009)
[25] Poovathingal,随机生物化学系统的全局参数估计方法,BMC生物信息学11(1),第414页–(2010)
[26] Lillacci,计算生物学中的参数估计和模型选择,《公共科学图书馆·计算生物学》6(3)pp e1000696-1-17–(2010)
[27] 使用扩展卡尔曼滤波和{(chi)}2准则识别生物网络的Lillacci G Khammash M参数2010年第49届IEEE决策与控制会议(CDC10)10.1109/CDC.2006.376908
[28] Simon,最优状态估计(2006)
[29] Ristic,Beyond the Kalman Filter:跟踪应用的粒子过滤器(2004)
[30] Dvoretzky,样本分布函数和经典多项式估计量的渐近极小极大特征,《数理统计年鉴》27(3),第642页–(1956)·Zbl 0073.14603号
[31] 马萨特,德沃雷茨基-基弗-沃尔福威茨不等式中的紧常数,《概率年鉴》18(3)第1269页–(1990)·Zbl 0713.62021号
[32] 费希尔,《研究人员的统计方法》(1925年)
[33] Nocedal,数值优化(1999)
[34] Lee,酿酒酵母转录调控网络,《科学》298(5594),第799页–(2002)
[35] Gillespie,数值模拟耦合化学反应随机时间演化的通用方法,计算物理杂志22(4)第403页–(1976)
[36] 加拉西,GNU科学图书馆参考手册,3。编辑(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。