摘要

总结:SPSens是一个有效计算生化反应网络随机参数敏感性的软件包。参数敏感性分析是一种有价值的工具,可用于研究鲁棒性、药物靶向性和许多其他目的。然而,由于计算成本极高,当需要蒙特卡罗方法时,它在随机模型中的应用受到了限制。SPSens在单个软件包中提供了高效、最先进的灵敏度分析算法,因此可以轻松对生化反应网络的随机模型进行灵敏度分析。SPSens在C语言中实现算法,并估计系统参数对无穷小和有限摄动的灵敏度,在许多情况下,与基本方法相比,方差减少了几个数量级。SPSens的功能包括串行和并行命令行版本、与Matlab的接口以及几个示例问题。

可利用性:SPSens在GPL版本3下免费发布,可从以下网址下载http://sourceforge.net/projects/spsens/该软件可以在Linux、Mac OS X和Windows平台上运行。

联系人: mustafa.khammash@bsse.ethz.ch

补充信息: 补充数据可在生物信息学在线。

1简介

随机模型现在比以往任何时候都更多地用于研究、分析和预测生物、化学和生态学中发生的复杂动力学。当确定性或随机微分方程模型无法准确捕捉系统的离散性和随机性时,随机反应网络通常在随机化学动力学的框架内建模(Gillespie,1976年,1977). 除非在最简单的情况下,否则随机化学动力学模型无法精确求解,并且无法使用确定性或随机微分方程模型常用的模拟和分析方法。其中一个特别重要的分析工具是参数敏感性分析,它量化了系统输出变量如何受到模型参数扰动的影响。随机模型依赖于一组反应速率参数,评估系统行为对这些模型的依赖性是非常有趣的通过参数敏感性分析。这些知识有着广泛的应用,但随机灵敏度系数的计算是繁重的。特别是使用蒙特卡罗(MC)方法,但通常需要计算,因为它们需要进行大量模拟才能生成准确的统计数据。

虽然已经开发了使用线性噪声近似和Fisher信息矩阵进行灵敏度分析的软件包(科莫罗斯基等。, 2012),这种方法不适用于分子数波动特别大的系统,例如那些表现出双稳态的系统。最近报道了几种有效估计生化反应网络随机参数灵敏度的MC方法(安德森,2012;Plyasunov和Arkin,2007年;腊肠等。, 2010;Sheppard公司等。, 2012). 已经开发了现有的软件包,以提高随机模拟的效率;然而,此类软件包不包括敏感性分析方法。要执行敏感性分析,必须编写自定义代码或对现有代码进行重大修改。SPSens通过在单个软件包中包含高效、最先进的参数敏感性分析方法来解决这个问题。功能、实现和功能将在下面进行描述。

2方法

2.1随机敏感性分析

在随机化学动力学中,模型是通过指定一个物种列表来定义的t吨>0由离散状态向量描述,X(X)(t吨). 这些物种通过许多反应通道相互作用,每个反应通道都由化学计量学向量和倾向函数定义。倾向函数取决于一组反应速率参数θ。敏感性分析的目的是量化表格的输出函数(f)(X(X)(t吨;θ) )随θ分量的扰动而变化。SPSens估计的灵敏度系数类似于确定性系统通常计算的一阶灵敏度系数。由于系统的随机性预期值输出的-E类[(f)(X(X)(t吨;θ) )]-考虑特定系统参数的扰动。这些定义如下:,
(1)
哪里θj个θj个系统参数和T型>0是固定的兴趣时间。尽管(1)可以直接从化学主方程(CME)导出,除了最简单的例子外,这些方程的解是很难解决的。然而,可以使用MC方法和随机模拟算法(SSA)来估计z(z)j个.

对于MC方法,a灵敏度估计器,表示论坛,是构造和计算的通过随机模拟。大量样本(N个)对估计量进行了模拟,并对样本进行了平均,论坛,然后作为敏感性估计。其准确性可以通过考虑其偏差(如果存在)和根据样本方差构建点敏感性估计的置信区间来评估。因此,对于最准确的估计而言,期望具有无偏差或小偏差和低方差的估计。已经提出了几个不同的灵敏度估计量,每个估计量的偏差和方差性质都不同。

图1。

SPSens中包含的蒙特卡罗随机参数敏感性算法

有限差分(FD)估计量是最直接、最普遍适用的估计量之一。FD估计的计算方法是,首先在标称参数集上模拟系统,然后在受少量有限扰动的参数集上进行模拟,然后取FD商。许多FD商样本的样本平均值给出的结果估计值有偏差,这取决于实现的特定离散化方案。估计值的方差取决于怎样生成样本。一种直接的方法是使用独立且同分布的随机数(IRN)生成样本,但这种估计通常具有高方差,并且需要许多样本。相反,通过生成以适当方式关联的样本,可以显著降低这种方差。使用公共随机数(CRN)可以显著减少方差以提高效率。尽管该方法与直接方法SSA相结合(Gillespie,1977年)可以很容易地应用于大幅减少方差,使用共同反应路径(CRP)方法可以进一步提高效率(腊肠等。, 2010). CRP使用基于马尔可夫过程随机时间变化表示的SSA实现CRN,以显著降低方差。另一种方法是耦合有限差分(CFD)方法(安德森,2012),它同时模拟每个参数集的耦合过程,以在许多情况下,特别是在考虑较大时间间隔时,获得具有高度期望方差特性的FD估计。

其他方法直接考虑参数的无穷小扰动以获得估计。其中一种方法,Girsanov似然比(GLR),首次在随机化学动力学的背景下引入(Plyasunov和Arkin,2007年). 该方法使用Girsanov测度变换导出数值可处理的加权系数,该变换可以在仿真过程中计算,以给出无偏的灵敏度估计。GLR虽然没有偏见,但通常具有较高的方差,在某些情况下可能效率低下。正则化路径导数(RPD)方法是一种替代方法,它考虑原始问题的紧密正则化,并计算每个样本路径的导数以估计灵敏度(Sheppard公司等。, 2012). RPD估计通常比其他方法更有效,对于某些问题,方差减少了10个数量级以上。

使用示例随机生化网络对这些方法进行了简单的数值比较,见补充材料.

2.2实施

SPSens执行中总结的灵敏度算法图1在C中,不需要标准发行版以外的外部库。为了运行该程序,首先在C源文件中定义感兴趣的生化网络,方法是指定物种、反应和参数,另外,如果需要GLR或RPD,则指定倾向函数相对于系统参数的偏导数。SPSens分布提供了几个例子,并且可以很容易地针对用户定义的网络进行修改。

一旦定义了问题,就会编译代码以构建可执行程序,该程序可以从命令行或使用脚本语言运行。灵敏度分析算法可以在问题文件中指定,也可以通过设置适当的命令行标志在运行时指定。采样时间、参数和初始条件也可以通过命令行指定,允许对各种条件执行灵敏度分析,而无需重新编译任何代码。

使用普通随机数(CRP、CRN)的方法需要对驱动SSA的伪随机数进行特殊处理。因此,使用RngStream包来处理随机数生成(L'Ecuyer公司等。, 2002). 该软件包支持长周期的并行随机数生成流,这对于确保随机数的正确同步和并行流的独立性非常有用。

2.3其他特征

除了灵敏度分析程序外,SPSens还包括精确的SSA,可用于使用相同的模型定义生成单个样本路径或轨迹集合。命令行敏感性分析和模拟程序也使用消息传递接口(MPI)实现,允许程序在网格或多核个人计算机上并行运行。

SPSens包括使用对偶抽样(AS)。AS是一种广泛使用的方差减少技术,在许多情况下,它会在样本中引起负相关,从而产生具有更紧置信区间的估计。通过从命令行设置单个标志,AS很容易与SPSens中的所有算法结合。然而,应该注意的是,AS的方差减少通常是适度的,并且通常不保证方差减少,因此使用AS时应牢记这一点。

最后,SPSens附带了允许使用MEX接口从MATLAB编译和运行SPSens C代码的源代码。其中包括一个示例m文件脚本,以演示如何在MATLAB中构建和调用程序。

更多详细信息可以在SPSens发行版提供的《用户指南》中找到。

3结论

SPSens是一个免费且易于使用的软件包,它实现了离散随机生化反应网络参数敏感性分析的有效方法。SPSens允许用户快速轻松地在算法之间切换,以找到解决特定问题的最有效方法。

一般来说,无法确定哪种算法最适合给定的问题,因为每种方法的性能取决于许多因素。然而,在实践中可以遵循一些一般准则。GLR是唯一无偏见的方法,但它通常效率很低,需要大量的计算工作才能产生准确的结果。在大多数情况下,带有IRN和CRN的FD方法的效率明显低于CFD和CRP方法,主要用于演示目的。在适用的情况下,RPD方法对于各种各样的问题都非常有效,但需要明智地选择正则化参数才能获得有效的性能。然而,三种高效方法(RPD、CFD和CRP)中哪一种最有效取决于问题。使用SPSens计算的示例结果以及对这些问题的更详细讨论见补充材料.

资金:M.K.承认国家科学基金会通过ECCS-0835847拨款和人类前沿科学计划RGP0061/2011拨款提供的研究资金。

利益冲突:未声明。

参考文献

安德森
D类
连续时间马尔可夫链参数敏感性的有效有限差分方法
SIAM J.数字。分析。
2012
,卷。 
50
(第
2237
-
2258
)
吉莱斯皮
D类
耦合化学反应随机时间演化数值模拟的一般方法
J.计算。物理学。
1976
,卷。 
22
(第
403
-
434
)
吉莱斯皮
D类
耦合化学反应的精确随机模拟
《物理学杂志》。化学。
1977
,卷。 
81
(第
2340
-
2361
)
科莫罗斯基
M(M)
Stochsens–用于随机化学系统灵敏度分析的MATLAB软件包
生物信息学
2012
,卷。 
28
(第
731
-
733
)
L'Ecuyer公司
P(P)
具有许多长流和子流的面向对象的随机数包
操作。研究。
2002
,卷。 
50
(第
1073
-
1075
)
普利亚苏诺夫
阿金
A类
离散事件系统的有效随机灵敏度分析
J.计算。物理学。
2007
,卷。 
221
(第
724
-
738
)
腊肠
M(M)
离散随机化学反应网络参数敏感性的有效计算
化学杂志。物理学。
2010
,卷。 
132
第页。 
034103
 
Sheppard公司
P(P)
离散随机化学系统参数敏感性计算的路径导数方法
化学杂志。物理学。
2012
,卷。 
136
第页。 
34115
 

作者注释

副主编:Martin Bishop

补充数据