跳到主要内容

用滑动窗口求解化学主方程

摘要

背景

化学主方程(CME)是一个常微分方程系统,它将化学反应网络的演化描述为一个随机过程。其解产生系统在每个时间点的概率密度向量。在许多情况下,数值求解CME的计算成本很高,甚至不可行,因为可达状态的数量可能非常大或无限。我们引入了滑动窗口方法,该方法通过执行一系列局部分析步骤来计算CME的近似解。在每个步骤中,只考虑一个可管理的状态子集,表示进入状态空间的“窗口”。在随后的步骤中,窗口遵循概率质量移动的方向,直到感兴趣的时间段过去。我们通过估计化学物种种群的上下限,基于对系统未来行为的确定性近似来构造窗口。

结果

为了证明我们的方法的有效性,我们将其应用于文献中前面描述的几个示例。实验结果表明,与全局分析相比,所提出的方法大大加快了分析速度,同时仍然提供了高精度。

结论

滑动窗方法是解决化学主方程数值算法性能问题的一种新方法。该方法有效地近似了各种化学反应系统在感兴趣的时间点的概率分布,包括事先不知道化学物种种群大小上限的系统。

背景

实验研究报告了细胞过程中随机机制的存在[19]因此,在过去十年中,随机性在系统生物学中受到了广泛关注[1015]. 随机特性的研究要求计算模型考虑化学反应的固有随机性。随机动力学方法可能会产生与确定性模型预测的动力学显著不同的动力学,因为系统可能会遵循具有非零可能性的非常不同的场景。

假设系统在空间上是均匀的,并且具有固定的体积和温度,在每个时间点,生化反应网络的状态由所涉及的化学物种的种群向量给出。系统的时间演化可以用马尔可夫过程来描述[16],通常表示为常微分方程(ODE)系统,称为化学主方程(CME)。

CME可以通过应用数值解算法进行分析,或者间接地通过生成潜在马尔可夫过程的轨迹进行分析,这是Gillespie的基础随机模拟算法[17,18]. 在前一种情况下,这些方法通常基于马尔可夫过程的矩阵描述,因此主要受系统大小的限制。Stewart对离散状态Markov过程数值分析的最成熟方法进行了综述和比较[19]. 这些方法计算马尔可夫过程在若干时间点的概率密度向量,达到先验指定的精度。如果可以应用数值求解算法,那么它们所需的计算时间几乎总是比随机模拟少得多,而随机模拟只给出感兴趣的度量值的估计。如果不仅用随机模拟估计状态变量的均值和方差,而且还估计某些事件的概率,则情况尤其如此。然而,对于许多实际系统,可达状态的数量是巨大的,甚至是无限的,在这种情况下,数值求解算法可能不适用。这主要取决于化学物质的数量。在低维(例如<10)中,可以直接求解CME,而在高维中,随机模拟是唯一的选择。在随机模拟的情况下,一旦轨迹的数量足够大,可以获得感兴趣的度量的估计值,以达到所需的统计精度。然而,模拟求解技术的主要缺点是需要大量的轨迹才能获得可靠的结果。例如,为了将估计的置信区间减半,必须生成四倍以上的轨迹。因此,随机模拟通常只有在对结果准确性的置信度很低的情况下才可行。

在本文中,我们缓解了CME数值求解算法的性能问题。我们没有对状态空间进行全局分析,而是提出了滑动窗法,包括一系列对状态空间重要部分的局部分析。在序列的每一步中,我们动态地选择一个时间间隔,并计算一个可管理的可达状态子集的近似数值解。为了确定在特定时间段内相关的状态,对于每个化学物种,我们估计了种群大小的上限和下限。这就产生了一个“窗口”的边界,其中大多数概率质量在感兴趣的时间间隔内保持不变。如图所示1当以逐步方式分析系统时,窗口在状态空间中“滑动”。在每一步中,初始条件由概率向量给出(其支持用浅灰色表示),并构造矩阵来描述马尔可夫过程中窗口(用虚线矩形表示)当前所在的部分。然后使用标准数值算法求解相应的ODE,并获得下一个向量(以深灰色表示)。

图1
图1

滑动窗口方法。在每个迭代步骤中,窗口W公司 捕获集合S公司 概率质量的重要部分最初位于(浅灰色)的状态的集合S公司+1时间步长后到达的状态(深灰色),以及其间访问的状态。

我们重点介绍两种特定的数值求解方法均匀化方法Krylov子空间方法我们比较了它们用于求解滑动窗口迭代过程中出现的ODE时的效率。我们还将滑动窗口方法与以全局方式应用的数值算法进行了比较,即对于可控制大小的系统,对所有可达状态(不仅是窗口状态)进行了比较。我们感兴趣的是马尔可夫过程的概率分布,而不仅仅是均值和方差。这些概率很难用随机模拟来准确估计。因此,我们仅将滑动窗口方法获得的解与数值解算法进行比较,而不与随机模拟进行比较。

最近,有限状态投影算法已经提出了解决CME的(FSP算法)[20,21]. 它们与我们的方法不同,因为它们完全基于底层图的结构,而滑动窗口方法基于马尔可夫过程的随机特性。FSP算法从初始投影开始,如有必要,可以扩展初始投影的大小。扩展的方向和大小是基于对系统的定性分析,以宽度优先搜索的方式选择的。目前尚不清楚为了在下一时间步中捕获大部分概率质量,状态空间需要探索多远。因此,如果投影尺寸太小,则必须使用扩展投影重复计算。此外,对于大多数模型,概率质量的主要部分在状态空间中的位置遵循一定的方向,而展开是在所有方向上进行的。因此,执行了不必要的计算,因为投影包含访问概率很小的状态。相比之下,在滑动窗口方法中,我们根据反应倾向和时间步长确定下一个计算步骤的概率质量的位置和方向。我们获得的投影明显小于FSP中使用的投影,而我们方法的精度与FSP的精度类似。通过这种方式,我们节省了大量内存和计算量,因为与计算窗口的概率分布相比,我们的窗口构造的时间复杂度很小。在我们的模拟中,我们从不需要使用较大的窗口重复计算概率。

福克-普朗克方程是CME的近似,可以有效地获得其解[22,23]. 然而,这种近似并没有考虑到系统的离散性,而是通过假设一个连续的状态空间改变了基础模型。其他近似CME定义的概率分布的方法基于稀疏网格方法[24],光谱法[25]或时间尺度的分离[26,27]. 后一种方法使用化学物质子集的准静态假设,并计算系统抽象模型的解。相反,我们提出了一种计算CME直接解的算法。我们的方法也与套叠技术有关[18,28],因为它们需要估计化学物种种群大小的上下限,就像我们的方法一样。这个时间跳跃必须足够小,以使种群向量的变化不会显著影响系统的动力学。在预测动态选择的时间段内的未来动态时,我们的方法不同于跳跃的计算。更准确地说,我们确定下一个时间步的长度,同时近似处理未来的行为。

在这里,我们更详细地介绍了滑动窗口方法,并对均匀化和Krylov子空间方法的窗口解进行了额外的比较。此外,我们改进了算法的实现,并在更多示例上进行了评估,例如详细报道的双稳态切换开关。

本文的其余部分组织如下。我们首先在背景部分描述建模方法的理论框架。在结果部分,我们介绍了滑动窗口方法和CME的数值求解方法。实验结果在章节结果的末尾给出。

随机模型

我们将生化反应网络建模为从随机化学反应动力学导出的马尔可夫过程[16,29]. Gillespie为耦合化学反应的Markovian模型提供了物理证明[17]. 我们考虑一个固定的反应体积n个空间上均匀且处于热平衡的不同化学物种。系统的状态由向量给出x个 ,其中-第个条目,表示为x个 描述类型的分子数我们假设分子随机碰撞,化学反应在随机时间发生。R(右)1, ...,R(右) k个 ,我们表示不同类型的化学反应,每种类型R(右) , {1, ...,k个},我们将倾向函数α :≥0.倾向函数的形式为

(1)

哪里c(c) >0是一个常量 是类型的分子数被类型的反应消耗的R(右) .倾向α (x个)决定反应的“速度”R(右) 在里面x个,如下所述。请注意等于所有不同反应物组合的数量。除了倾向函数外,我们还将变化向量v() n个具有R(右) 描述了反应类型的影响R(右) .如果x个是当前状态α (x个)>0则x个+v(v)()是类型为的反应后系统的状态R(右) 。请注意α (x个)>0表示x个+v(v)()不包含负条目。

我们用以下公式表示系统的初始状态 并定义S公司 作为所有状态的集合,可以从通过任意数量的反应,即,S公司是的最小子集这样的话 S公司x’ S公司如果存在 {1, ...,k个}和x个 S公司具有α (x个)>0和x个+v(v)()=x’。请注意S公司是可数的,但可能是无限的。

示例1 我们描述了酶催化底物转化通过三个反应R1:E类+S公司,R(右)2:E类+S公司,R(右):E类+该网络包括四种化学物质,即酶(E)、底物(S)、复合物(ES)和产物(P)分子。变化矢量为v(1)= (-1, -1, 1, 0),v(v)(2)= (1, 1, -1, 0),和v(3)= (1, 0, -1, 1)。对于(x个1,x个2,x个,x个4) ,倾向函数是

如上所述,从初始状态y可以到达的状态集= (1,2,,4)是有限的,因为守恒定律y1=x个1+x个 和y2=x个2+x个+x个4,其中我们假设y=4= 0.

示例2 我们考虑一个基因表达模型[12],它涉及两种化学物质,即mRNA(M)和蛋白质(P)。通过反应R模拟基因转录到mRNA1:M、 通过R将mRNA翻译成蛋白质2:M(M)M(M)+P、 R降解mRNA:M(M)和R降解蛋白质4:P(P).状态是一对(x个 M(M) ,x个 P(P) ) .如果我们假设最初系统中没有mRNA分子和蛋白质,即y= (0, 0),然后是S=因此是无限的。倾向函数为

化学主方程

我们定义了一个时间齐次的规则马尔可夫过程[30](CTMC)(X(X)(t吨),t吨 ≥0)具有状态空间S公司 。我们假设X(X)由化学反应触发。是的初始状态X(X),这意味着公共关系(X(X)(0)=) = 1. 我们假设反应的概率R(右) 发生在下一个无穷小的时间间隔[t吨,t吨+τ),τ>0由给定

对于x个 S公司我们定义的概率是X(X)处于状态x个时间t吨通过(t吨)(x个)=公共关系(X(X)(t吨)=x个|X(X)(0) =). 这个化学主方程(CME)描述了X(X)通过微分方程[29]

(2)

在续集中,对方程(2)更有利。它是通过定义无穷小生成矩阵Q= ((x个,x’))x个,x’S公司CTMC的X(X)通过

其中我们假设状态空间的固定枚举。注意(可能无限)矩阵的行和为零,并且λ x个 = -(x个,x个),的退出率州的x个,是平均停留时间的倒数x个.

T型(0)等于单位矩阵、和,用于τ>0,让T型(τ)是步骤的转移概率矩阵τ包含个条目T型(τ)(x个,z(z))=公共关系(X(X)(t吨+τ)=z(z)|X(X)(t吨)=x个). 的元素T型(τ)是可微的并且是的导数T型(τ)τ= 0. 如果给出了,并且X(X)被认为是有规律的,T型(τ)Kolmogorov向后和向前方程

(3)

使用一般解决方案T型(τ)=e(电子).让(t吨)是包含条目的行向量(t吨)(x个)的x个 S公司那么CME的矢量形式是

(4)

如果支持x个S公司λ x个 <∞,等式(4)具有通用解决方案

(5)

其中矩阵指数由e(电子)Qt(数量)=.

在续集中,我们将利用以下事实:{T型(τ)|τ≥0}是一个过渡半群并满足Chapman-Kolmogorov方程[30]为所有人τ1,τ2≥ 0. t吨0, ...,t吨 第页 ≥0是这样的t吨0<<t吨 第页 然后,

(6)

这意味着,对于t吨0=0和t吨 第页 =t吨,我们获得(t吨)通过等式中的迭代方案()的t吨1-t吨0,t吨2-t吨1, ...,t吨 第页 -t吨第页-1.

如果状态空间是无限的,我们只能计算(t吨).但即使是有限的,有几个因素会妨碍方程中矩阵指数的有效求解(5). 首先,矩阵的大小可能会很大,因为它随着状态变量的数量呈指数增长。然而,通常是稀疏的,因为反应类型的数量与状态的数量相比很小。但即使在稀疏通常只有近似解才能有效计算。将无穷和中足够多的项相加数值不稳定,如包含严格的正负条目,导致严重的舍入错误[31]. 对于等式形式的一阶线性方程组,存在各种数值求解方法(4). 然而,它们中的许多并没有用处,因为它们没有保留.文献中存在一些调查和比较[19,32,33]. 最流行的是基于均匀化的方法[34,35]Krylov子空间中的近似[36],或数值积分[37,38]. 我们将在数值求解方法一节中更详细地描述前两种方法。

结果

滑动窗法

本文提出的算法的核心思想是计算近似值属于(t吨)以迭代方式,如等式(6). 更准确地说,我们计算一系列近似值这样对于子集W公司 j个 状态空间的,j个 {1, ...,第页},为所有人x个 W公司 j个 .集合W公司1, ...,W公司 第页 被称为窗户,我们假设W公司 j个 包含时间间隔内概率质量(大部分)集中的状态[t吨j个-1,t吨 j个 ). 我们讨论窗户的构造W公司 j个 稍后。

j个 是指的矩阵W公司 j个 ,即我们定义 j个 (x个,x’)=(x个,x’)如果x个,x’ W公司 j个 、和 j个 (x个,x’)否则=0。注意,为了演示的简单性,我们保留了一个固定的枚举S公司并假设每个 j个 大小与相同然而,该方法的实现仅考虑 j个 包含中的状态条目W公司 j个 。对于τ j个 =t吨 j个 -t吨j个-1,我们定义

(7)

哪里= (1 )T型D类 j个 是对角线矩阵,其主要对角线项为x个 W公司 j个 否则为零。行向量(1 )T型位置处有一个否则为零。

j个-第步,矩阵包含入住的可能性τ j个 时间单位在W公司 j个 从一个国家到另一个国家。作为初始概率,公式(7)使用近似值适用于所有州x个 W公司 j个 对角矩阵确保概率质量位于W公司j个-1\W公司 j个 在计算过程中忽略,即仅忽略交点的元素W公司j个-1W公司 j个 向量中可以有非零项D类 j个 。这是必要的,因为 j个 不包含以外状态的转换速率W公司 j个 (这些状态很吸引人)。直观地,向量描述了概率质量在内部移动后的位置W公司 j个 .

尽管 j个 不是CTMC的发电机,等式(7)对所有状态都有一个简单的解释x个 W公司 j个 .让我们修复j个现在,让CTMC与…相同X(X),除了所有州x’ W公司 j个 正在吸收(即一次x’已到达,无法离开)。让初始概率分布是这样的为所有人x个 W公司 j个 。那么,对于所有人x个 W公司 j个 .面向所有人j个,向量是次随机的,并且在每个步骤中其条目的总和都会减少,即,

概率质量“丢失”,因为我们不考虑条目对于x个 W公司j个-1\W公司 j个 ,当我们与相乘时D类 j个 此外,我们失去了离开的可能性W公司 j个 在下一个τ j个 时间单位,因为是一个超突变矩阵。如果j个,在时间间隔内[t吨j个-1,t吨 j个 )大部分概率质量保持在W公司 j个 ,然后是近似误差对所有人来说都很小x个 S公司.之后损失的概率质量j个近似产生的步长由下式给出

(8)

因此,如果公式(7)精确求解后,滑动窗方法的总近似误差为η 第页 注意,公式(8)是矢量所有分量的误差之和.

窗户构造

在迭代的每个步骤中,窗口W公司 j个 必须选择错误η j个 保持较小。如果是这样的话W公司 j个 满足以下条件:(a)具有足够高的概率X(X)(t吨j个-1) W公司 j个 ,(b)离开的概率W公司 j个 在时间间隔内[t吨j个-1,t吨 j个 )足够小。

要求(a)意味着W公司 j个 包含支持也就是说,一个子集S公司 j个 S公司这样的话很小。在第一步中,我们设置S公司1= {}。对于j个>1、窗户W公司 j个 在之后构造已计算。我们修了一个小δ>0并选择S公司 j个 = {x个|>δ}。如果支持较大且几乎均匀分布,可能需要构造S公司 j个 这样的话小于某个固定阈值。然而,我们的实验结果表明,使用固定阈值会产生良好的结果,这使得对支持度进行排序的额外工作在实践中是不必要的。注意,要求(a)意味着W公司 j个 W公司j个-1横断。因此,在每一步中,我们都会沿着概率质量移动的方向“滑动”窗口。

本节的后续部分重点讨论需求(b),其中有必要预测流程的未来行为。找到集合的一种可能性W公司 j个 满足要求的是对t吨 j个 -t吨j个-1初始状态为的时间单位S公司 j个 。如果我们的目标是获得准确的近似值,那么这可能会很昂贵。大多数模拟运行与系统的平均行为相对应。然而,有些事件可能不太频繁,但仍有很大的可能性。因此,我们提出了一种依赖于状态控制确定性近似的思想,即给定初始状态z(z) S公司 j个 ,估计每个状态变量在下一个期间可以采用的最大值和最小值τ j个 =t吨 j个 -t吨j个-1时间单位。更确切地说,对于每个维度d日 {1, 2, ...,n个},我们计算值, 这样的话

很小,其中X(X) d日 (τ)是d日-随机向量的第个分量X(X)(τ).

极值的计算,在几个州执行z(z)都是随机选择的。我们的实验结果表明,当考虑10个以上的状态时,我们的结果的准确性没有提高。A类 j个 S公司 j个 是随机状态的集合。通过计算,我们得到了时间间隔内每个状态变量的最大值和最小值的估计[t吨j个-1,t吨 j个 )在以下条件下X(X)(t吨j个-1) S公司 j个 .窗口W公司 j个 现在被构造为S公司 j个 以及其中的所有状态也就是说,W公司 j个 等于

(9)

对于固定状态z(z) A类 j个 我们利用马尔可夫链的规则结构来计算.我们从状态开始z(z)并逐个更新状态变量。我们假设在很短的时间间隔Δ内,反应类型的速率R(右) 保持不变,即等于α (z(z)). 然后是R(右) -下一个Δ时间单位内的跃迁是带参数的泊松分布α (z(z))Δ. 我们可以通过预期来近似这个数字α (z(z))泊松分布的Δ。注意,上述假设是有根据的,因为在耦合化学反应的情况下,倾向α (x个)在x个,如果只考虑基本反应,即对应于单个机械步骤的反应,因此最多有两个反应物。一般来说,反应可能有中间产物和/或平行反应路径。然而,它们总是可以分解为基本反应。由于我们对上限和下限感兴趣,我们还考虑了标准偏差泊松分布。我们假设,如果当前状态为x个,在Δ时间单位内

  • 至少,

  • 至多

类型转换R(右) 被带走了。注意,例如,α (z(z))Δ=1,则我们有91.97%的置信度,即反应的实际数量位于区间内

(10)

κ = 0, 1,.... 迭代

(11)

产生连续确定的最坏情况近似X(X)(t吨+ Δ),X(X)(t吨+ 2Δ),... 在以下条件下X(X)(t吨)=z(z).对于函数α 在状态变量中增长极快的情况下,迭代可能会产生错误的近似值,因为它基于这样的假设,即在[0,Δ)期间倾向是恒定的。

在生化反应网络的背景下,α 最多是二次的,因此公式(11)产生足够的结果。对于给定的系统,我们执行等式中的近似(11)对于所有可能的组合。可以跳过优先处理导致状态空间中相反方向的转换类型的组合,因为它们不会给出最坏情况边界。例如,考虑示例(1)c(c)1=c(c)2=c(c)= 1,z(z)=(10,10,100,0),Δ=0.01。如果我们假设更多类型的反应R(右)2R(右)发生(比平均值少)R(右)1,我们得到、和这意味着复杂分子的数量减少x个(1)= (14,12, 96, 2). 我们可以省略包含这两者的组合.作为R(右)1等同R(右)2反之亦然,这些组合不会产生状态变量极值的良好近似值。一般来说,反应网络的依赖关系图可能有助于识别那些最大化特定人群的组合(另请参阅实验结果部分)。

在续集中,每个选择的组合都被称为分支因为,对于固定z(z),相应的迭代导致不同的后续x个(+1)请注意,对于特定分支 {1, ...,k个}我们修复κ =,或κ =为所有人。迭代在以下时间结束τ j个 步长(其中最后一个时间步长是余数而不是Δ),以及极值由迭代期间状态变量的最小值和最大值给出。更具体地说,,其中1≤d日n个,x个()=、和z(z)=x个(0).

计算在表中的伪代码中进行了描述1(左栏),调用ContDetApprox公司。注意上标指的是当前分支,而不是等式中的迭代(11)这在第19行中执行。分支数量为2n个因为每个维度的最大值和最小值都是必要的。在第17行中,我们根据当前分支决定,是否κ 设置为,或.

表1方法ContDetApprox公司(左)和主程序s窗口(右)

关于时间步长Δ的选择,我们建议动态选择Δ,以便等式中的间隔(10)至少涵盖了相应泊松分布概率质量的80%。显然,在更大的区间覆盖更多概率质量的情况下,该方法的准确性会提高。对于我们的实验结果,我们选择Δ,以便λ x个 ·Δ=1产生了足够准确的结果。

滑动窗口算法

在表的右栏中1我们描述了称为s窗口,以伪代码表示。第2-14行中的for循环实现了通过连续计算向量 j个 j个-1输入ϵ是第13行中ODE的解引起的总近似误差的界。阵列t吨包含时间实例t吨0, ...,t吨 第页 对于我们的实验结果,我们比较了下面解释的两种不同的时间步进机制。参数δ是用于删除这些状态以支持j个-1概率小于δ。我们定义S公司 j个 作为所有状态的集合x个为此j个-1(x个)大于δ在第4行中。请注意,对于j个=1组S公司1仅包含初始状态.在第6行中,兰特(S公司 j个 ,国家数量)返回一组状态数随机元素来自S公司 j个 用于构造向量的b条+b条-在第7-10行中。窗口中所有状态的速率条目W公司 j个 (参见公式(9))在第11行中计算,所有剩余条目 j个 设置为零。第13行调用了一个求解方法来计算 j个 j个-1例如,这可以是均匀化方法、ODE解算器或基于Krylov子空间近似的方法。我们经过了一段时间τ j个 和相应的分数近似误差。

我们可以从输出中计算概率质量的总损失 第页 通过η 第页 = 1 - ∑ x个 第页 (x个). 该值包括算法的两个近似误差:(1)离开窗口的概率W公司 j个 在时间间隔内[t吨j个-1,t吨 j个 )(2)概率这是由于窗口滑动而丢失的,通过与乘法得到D类 j个 (参见公式(7)).

请注意,为了提高获得的精度,始终可以重复计算步骤。更准确地说,我们可以通过增加等式中区间的置信度来确定更大的窗口(10)即,通过选择时间步长Δ类型转换的最大/最小数目R(右) 存在于具有一定置信度的区间内(例如,置信度为80%)。然而,对于我们的实验结果,我们没有重复任何计算步骤,因为我们总是获得足够准确的结果。

时间间隔

对于我们的实验结果,我们比较了算法的两种不同的时间步进机制s窗口(见表1,右侧)。我们要么选择等距的时间步长τ j个 =τ,对于所有人j个,或者我们决定τ j个 在窗户施工期间W公司 j个 (自适应时间步长)。后一种方法产生更快的运行时间。根据系统的动力学,长时间步长可能会导致三个问题:(1)窗口大,矩阵大 j个 可能超过工作记忆容量,(2)在长时间步长内,系统的动态可能会有很大差异 j个 (3)该窗口可能包含仅在更短的时间间隔内有效的状态。另一方面,如果时间步长太小,则必须执行主循环的多次迭代,直到算法终止。窗口几乎完全重叠,尽管每个步骤可能只需要很少的时间,但整个过程的计算成本可能很高。一种可能性是固定窗口的大小并相应地选择时间步长。但这也不一定导致算法运行时间短。原因是,求解方法的时间复杂度不仅取决于表示窗口的矩阵的大小,还取决于其数学特性。

通过计算可以避免上述问题τ1, ...,τ 第页 窗户施工期间W公司 j个 如下所示。我们计算了当时重要的状态数t吨j个-1并将其传递给ContDetApprox公司第9行(见表1). 我们在Algorithm中运行while循环ContDetApprox公司(见表1,left)直到(1)窗口至少有一定的大小,并且(2)窗口中的状态数超过当时有效状态数的两倍t吨j个-1第一个条件确保窗口超过某个最小大小,例如500个州。第二个条件确保新窗口刚好足够大,可以将概率质量移动到S公司 j个 更准确地说,它确保了S公司1,S公司2,...不重叠,且后续集合相邻(如图所示1). 请注意,这可以确保生成的窗口不包含许多仅在更短的时间间隔内有效的状态。

while-lop终止时,我们传递变量的值时间ContDetApprox公司s窗口并设置τ j个 价值时间显然,在s窗口我们添加了一个表示到目前为止经过的时间的变量,第2行中的for循环被替换为while循环,该循环在经过的时间超过时停止t吨随后,我们给出了滑动窗口方法的实验结果,其中我们以上述方式使用自适应时间步长。

数值求解方法

在本节中,我们介绍了两种数值求解算法的理论基础,即均匀化方法和Krylov子空间方法。我们近似CME的全局解(参见方程(5))以及算法第13行中要求的局部解决方案s窗口(另请参见等式(7)).

均匀化

均匀化方法可以追溯到Jensen[34]也称为Jensen方法、随机化或离散时间转换。在计算机系统的性能分析中,这种方法很受欢迎,并且通常优于其他方法,如Krylov子空间方法和数值积分方法[19,39]. 最近,均匀化也被用于求解CME[4042].

全局均匀化

让(X(X)(t吨),t吨 ≥0)是有限状态空间的CTMCS公司一致化的基本思想是定义离散时间马尔可夫链(DTMC)和泊松过程。DTMC随机地与X(X),这意味着如果步数在[0,t吨)给出,泊松过程跟踪时间,如下所述。

回想一下λ x个 是国家的退出率x个 S公司、和是单位矩阵。我们定义了一个均匀化率λ这样的话λ≥最大值x个S公司λ x个 并构造,DTMC的转移矩阵X(X)注意P(P)定义自循环概率1-λ x个 /λ一个州的x个,当且仅当λ>λ x个 。对于k个≥1,随机矩阵P(P)k个包含k个-阶跃转移概率,如果(0)是初始分布X(X),向量(k个)=(0)P(P)k个包含之后的状态概率k个DTMC中的步骤。时间间隔[0,t吨)具有带参数的泊松分布λt即。,

(12)

现在,方程(5)可以重写为[19,32,43]

(13)

等式(13)与等式相比,具有良好的性能(5). 没有涉及负面指控,因为P(P)是一个随机矩阵,并且λ> 0. 此外,(k个)可以通过以下公式进行归纳计算

(14)

如果P(P)稀疏,(k个)即使状态空间的大小很大,也可以有效地进行计算。求和下限和上限L(左)单位可以获得每个状态的x个截断误差[44]

(15)

可以是预先定义的误差容限ϵ>0的先验界。因此,(t吨)可以通过以下公式以任意精度逼近

(16)

只要所需的汇总数量不是特别大。

时间复杂性和刚度

作为λt使泊松分布变平,左截断点变大L(左)在等式中(16)在中线性增长λt,而有效泊松概率项的数量为[44]O(运行)(). 如果向量(L(左)),(L(左)+1), ...,(单位)使用以下公式计算单位矩阵-向量乘法(参见公式(14)),则均匀化过程的复杂性为O(运行)(νλt)其中ν是中非零元素的数量P(P).

如果基础模型为僵硬的在刚性模型中,底层系统的组件在不同数量级的时间尺度上运行,这在各种应用领域中都会出现,尤其是在系统生物学中。对于刚性模型,均匀化率λ≥最大值x个S公司λ x个 将对应于最快的时间刻度。相比之下,只有在对应于最慢时间尺度的一段时间内,才能观察到缓慢分量的显著变化。因此,均匀化方法非常耗时,因为刚度指数[45]t吨·最大值x个S公司λ x个 .

在后续部分中,我们展示了如何以局部方式应用均匀化,从而使刚度对该方法的性能产生较少的负面影响。换句话说,滑动窗口技术使均匀化即使对于刚性系统也能表现良好。

局部均匀化

我们现在结合了均匀化和滑动窗口方法。假设S公司可能是无限的,我们迭代地应用均匀化来求解方程(7). 更具体地说,在Algorithm的第13行s窗口(见表1,右),我们调用均匀化方法来近似

因此,P(P) j个 =+是次随机转换矩阵,其中λ j个 =.使用与等式相同的计算(16),我们得到了一个亚稳态矢量

(17)

哪里L(左)单位截断点取决于λ j个 τ j个 、和此外,作为λ j个 仅取决于W公司 j个 ,均匀化率通常小于全局均匀化率supx个S公司λ x个 ,这意味着等式中所需的项更少(17)比等式中的(16).

整个过程的计算复杂性为O(运行)(),因此,与全局均匀化相比,如果,其中λ=支持x个S公司λ x个 ν j个 是中非零元素的数量P(P) j个 .

Krylov子空间

Krylov子空间方法广泛用于大型特征值问题、线性方程组的求解以及矩阵指数和向量乘积的近似[46,47]. 我们对后一种近似方法感兴趣,并展示了它如何用于求解CME,无论是以全局方式还是与滑动窗口方法相结合。最近,Sidje等人将Krylov子空间方法应用于CME[21].

全局Krylov子空间方法

回想一下,CME的全局解决方案如下所示(t吨)=(0)e(电子)Qt(数量)在续集中,我们描述了e(电子)助教v(v),其中A类是一个N个×N个平方矩阵和v(v)是长度的列向量N个。我们得到了近似值(t吨)通过选择A类= ()T型v(v)= ((0))T型首先让我们假设t吨= 1. 其主要思想是生成-th Krylov子空间

并寻求近似解e(电子)A类v(v)从这个子空间。q个最小值是最低次的非零一元多项式,如下所示q个最小值(A类)v(v)= 0. 我们选择 这样q个最小值大于或等于在这种情况下,向量v(v),A类 v(v), ...,A类-1v(v)线性独立,对于每个元素x个 K 存在一个多项式q个最多度-1和x个=q个(A类)v(v)注意,在实践中,我们选择=30或=20,因为q个最小值通常大于30。然而,如果没有,问题可以解决确切地在中d日-第个Krylov子空间,其中d日是的度数q个最小值.直接与基础合作{v(v),A类 v(v), ...,A类-1v(v)}数值不稳定。因此,我们构造了一个正交基{v(v)1,v(v)2, ...,v(v) }的K 通过将Arnoldi算法应用于v(v),A类 v(v), ...,A类-1v(v).让H(H) 成为×用Arnoldi算法计算的上Hessenberg矩阵小时+1,是最后一个规范化值。V(V) 我们表示N个×带列向量的矩阵v(v)1,v(v)2, ...,v(v) 。那么

(18)

哪里e(电子) k个 是一个适当大小的列向量,其k个-th分量为1,所有其他分量为零。直觉上,等式(18)(b) 声明H(H) 是的矩阵投影A类到上面K w.r.t.依据V(V) .近似值e(电子)A类v(v)在里面K 表示使用V(V) e(电子)A类v(v)V(V) ,其中是大小向量.

我们选择

(19)

从而产生近似误差[46]

(20)

哪里ρ==========================================================||A类||2是的光谱范数A类.等式中的近似值(19)仍然涉及矩阵指数的计算H(H) ,但作为H(H) 尺寸较小且具有特定结构(上海森堡),这需要较小的计算工作量。对于小矩阵的矩阵指数,可以应用Schur分解和Padé逼近等方法[31].

现在假设时间瞬间t吨是任意的,即我们想要近似e(电子)助教v(v)对一些人来说t吨> 0. 为了控制近似误差,我们计算e(电子)助教v(v)逐步利用它对于τ1,τ 2≥ 0. 对于步长τ,我们近似e(电子)τAv(v)由||v(v)||2 因为Krylov子空间与A类τA是相同的,并且根据公式(20)如果||||2很小。

总之,Krylov子空间方法近似于e(电子)v(v)通过动态选择步长的时间迭代向前推进τ1,τ2,.... 在每个迭代步骤中,我们计算一个向量

其中最初是u个0=v(v).矩阵结果来自-构造子空间正交基的Arnoldi算法的第次执行跨度{u个-1,A类 u个-1, ...,A类-1u个-1}。当经过的时间等于t吨,我们得到了e(电子)v(v).

对于Krylov子空间方法的步长,一种流行的启发式方法是选择τ+1取决于误差的估计 上一步的。托尔>0是预先指定的公差。一个通用方案由三个步骤组成[36]. (1) 定义,(2)计算u个 和误差估计ϵ .(3)如果ϵ > 1.2托尔拒绝u个 ,更换ϵ-1带ϵ ,然后转至步骤(1)。对于我们的实验结果,我们使用了Expokit软件[48]其中小指数,,通过不可约Padé近似计算[49].

局部Krylov子空间方法

假设我们在算法的第13行中使用了Krylov子空间方法s窗口(见表1,右),近似值(参见公式(7)). 通过出租v(v)=,A类=、和t吨=τ j个 我们可以应用与全局情况相同的过程。注意,这会产生嵌套迭代,因为时间步τ j个 通常比Krylov子空间方法的时间步长大得多。对于Krylov子空间方法,使用矩阵 j个 而不是提供了重要优势。Arnoldi过程的速度比 j个 通常包含的非零条目少于同样,滑动窗口方法可能提供具有较小谱范数的矩阵|| j个 ||2这允许在Krylov近似过程中使用更大的时间步长,如我们的实验结果所示。

实验结果

我们在表中对这两种算法进行了编码1在C++中,并在3.16 GHz Intel双核Linux PC上进行了实验。我们讨论了示例1和示例2的实验结果,以及Goutsias的模型[50]和一个双稳态拨动开关[51]. Goutsias模型描述了噬菌体中抑制蛋白的转录调控λ涉及六种不同的物种和十种反应。双稳态拨动开关是基因开关的原型,具有两个相互竞争的阻遏蛋白和四个反应。图中列出了所有结果2.

图2
图2

滑动窗法的参数和结果.

如下文所述,我们还实现了Burrage等人提出的方法[21]为了在运行时间和精度方面与我们的算法进行比较。此外,对于有限示例,我们将我们的方法与全局分析进行了比较,即在每个步骤中都考虑了整个状态空间。我们没有将我们的方法与Gillespie模拟或基于Fokker-Planck方程的近似方法进行比较。前一种方法仅提供概率分布的估计,如果估计小概率,则不可行[52]. 后一种方法不考虑分子数的离散性,并且已知在这里考虑的小种群情况下提供了错误的近似值[53].

参数

我们修正了输入ϵ=10-8算法的s窗口所有实验(见表1,右侧)。我们选择了输入δ以动态方式确保j个-第十步我们损失的概率不超过10-5·τ j个 /(t吨 第页 -t吨0)通过限制在重要的州,也就是说,我们减少δ直到算法第4行之后s窗口成套设备S公司 j个 最多包含10个-5·概率小于前一组S公司j个-1.在图中2,我们列出了使用的平均值δ.

在下文中,我们给出了用于我们获得的实施例1和实施例2的结果的参数的细节。对于剩下的两个示例,我们列出了相应的化学反应和我们为图中的结果选择的参数2.

酶示例

对于示例1,我们尝试了不同的参数集,称为集合a)-c)(参见图2). 对于参数组合a),我们有c(c)1=c(c)2= 1,c(c)=0.1,从1000种酶和100种底物开始。在这种情况下,可到达状态的数量为5151。对于参数集b)和c),我们有c(c)1=c(c)2=c(c)=1,从100个酶和1000个底物以及500个酶和500个底物开始,分别产生96051和125751个可达状态。每次我们根据时间选择时间范围,直到大部分概率质量集中在所有底物分子转化为产物的状态。对于时间步τ j个 在算法中s窗口,我们应用上述条件。

我们考虑等式中迭代的四个分支(11)为了确定状态变量的上下限。(1) 为了估计复合分子的最大数量(以及酶群的最小数量),我们实施了更多类型的反应R(右)1比平均水平高(κ1=),类型较少R(右)2R(右)(κ=κ2=). (2) 通过考虑较少类型的反应R(右)1(κ1=)和更多类型R(右)2R(右)(κ=κ2=)复合群体变得最小(酶群体最大)。(3) 最小类型数的估计P(P)分子(以及类型的最大数量S公司分子)通过执行更多类型的反应获得R(右)2(κ2=),类型较少R(右)1R(右)(κ1=κ=). (4) 最后,更多类型的反应R(右)1R(右)(κ1=κ=),类型较少R(右)2(κ2=)最大限度地增加产物分子的数量(并使底物分子的数量最小化)。

以酶为例,如果初始条件是固定的,那么一种状态是由至少两个条目唯一确定的,比如复合物和产物分子的群体。然而,如果复杂分子的预期数量较高,矩形窗口形状的结果较差。原因是在这种情况下,概率质量位于对角线上(参见图). 如果有效状态集被矩形窗口捕获,则它可能包含许多不重要的状态。通过考虑窗口构造过程中所有状态变量的边界以及守恒定律,可以避免这个问题。更准确地说,图中的平行四边形通过计算每个值来构造属于P(P)上下限通过,其中= (1,2,0,0)是初始总体向量人口的上限和下限是E类,S公司,、和P(P).

图3
图3

平行四边形对于酶反应示例,可达状态集是有限的,并由对角线分隔,对角线由直线表示= 100 -P(P)如果100是酶分子的初始数目。对于某些参数集,窗口具有平行四边形,对应于概率质量移动的方向。

注意图中的平行四边形是由系统的守恒定律引起的。一般来说,应该考虑守恒定律,因为否则窗口可能与守恒定律不一致,即它可能包含无法到达的状态。

基因表达示例

在图中2我们给出了示例2的结果。参数集a)和参数集b)(称为集合a)和集合b)的区别在于,对于a)我们从空系统开始,对于b)我们从100 mRNA分子和1000蛋白质开始。对于这两种变量,我们都选择速率常数c(c)1= 0.5,c(c)2= 0.0058,c(c)= 0.0029,c(c)4= 0.0001. 我们使用的时间步长由时间间隔部分中的条件决定。请注意,我们无法使用全局方法求解此示例,因为可达状态的数量是无限的。专栏错误包含总错误η 第页 (参见公式(8))以及次(秒)指以秒为单位的运行时间。在列中百分比。我们列出了用于窗口构造的总运行时间的百分比。专栏平均风.大小指窗口中的平均状态数。

对于基因表达的例子,我们使用了四个分支:我们通过选择并将其最小化.反应R(右)2R(右)4与这个物种无关。我们通过选择最大化蛋白质群体、和并将其最小化、和.

Goutsias模型

该模型在图中称为Goutsias模型2,由以下化学反应组成[50]:

  1. 1:

    RNA T RNA+M

  2. 2:

    M T?

  3. 三:

    DNA。D T RNA+DNA。D类

  4. 4:

    RNA T?

  5. 5:

    DNA+D T DNA。D类

  6. 6:

    DNA。D T DNA+D

  7. 7:

    DNA。D+D T DNA.2D

  8. 8:

    DNA.2D T DNA。D+D

  9. 9:

    M+M T D公司

  10. 10:

    D T M+M

我们使用了与Goutsias相同的动力学常数[50]和Sidje等人[21]以及相同的初始状态。

下面,我们列出状态变量上界的分支。如果分别考虑相反的组合,则可获得下限。我们参考图4以便于说明简化分支选择的反应之间的依赖性。我们通过选择组合来最大化RNA种群.我们通过选择组合来最大化单体数量。我们通过选择组合来最大化二聚体分子的数量注意,虽然反应5消耗二聚体,但选择最大化系统中二聚体的数量。这是因为反应5是生成单体和二聚体所必需的。使用滑动窗口方法,我们永远不会耗尽内存,但在较长的时间范围内,运行时间可能会非常长。原因是窗口很大,因为系统在稍后的时间包含许多单体和二聚体。对于图中的结果2我们一直在考虑这个系统t吨=300,而Sidje等人[21],最长时间范围为t吨= 100. 在图中5我们绘制了物种的分布图M(M)D类.

图4
图4

Goutsias模型反应之间的相关性.

图5
图5

单体(左)和二聚体(右)在时间间隔[0,300)内的概率分布.

双稳态拨动开关

拨动开关涉及两种化学物质A类B类和四种反应。x个= (x个1,x个2) 。反应如下A类,A类,B类,B类及其倾向函数α1, ...,α 4由提供α1(x个)=c(c)1/(c(c)2+),α2(x个)=c(c)·x个1,α(x个)=c(c)4/(c(c)5+),α4(x个)=c(c)6·x个2注意,在本例中,倾向函数不是等式中描述的形式。1对于我们的实验结果,我们选择了与Sjöberg等人相同的参数[23]也就是说,c(c)1=c(c)4= 3·10,c(c)2=c(c)5= 1.1·104,c(c)=c(c)6=0.001,以及β=γ= 2. 初始分布为高斯分布(μ,σ2)带有μ=(133133)T型我们考虑了明显的四个分支,每个分支都旨在最小化/最大化这两个组件中的一个。分支最小化A类例如将具有较少的第一反应和较多的第二反应。

讨论

在这一节中,我们讨论了我们的算法的精度和运行时间,其中我们考虑了不同的求解方法和不同的时间步长机制。此外,我们将我们的方法与全局分析进行了比较。

准确性

列标记为错误在图中2显示总错误η 第页 (参见公式(8))滑动窗方法加上均匀化误差(以ϵ=10为界-8). 使用Krylov子空间方法的误差产生了相同的精度,因为对于均匀化和Krylov子空间方法,误差界是先验指定的。对于所有示例,总误差不超过1×10-4这意味着在整个过程中损失的概率质量不超过0.01%。当然,可以在Algorithm的while循环中添加精度检查s窗口,根据需要展开当前窗口,然后重新计算。但由于该方法始终返回一个小错误,因此忽略了这一点。

我们还考虑了相对误差,即,对于州x个 W公司 j个 具有> 10-5.我们近似值通过求解方程式(13)通过全局均匀化,其中我们使用截断误差ϵ=10-8由于这只有在状态空间有限的情况下才可能实现,因此我们只比较了酶的相对误差。我们的计算表明,相对误差始终小于10-4.

为了支持我们在窗口构建部分的考虑,我们进行了实验,在实验中我们只选择了Algorithm第17行中的平均值ContDetApprox公司(见表1,左)。更准确地说,对于窗口的构造,我们不考虑反应数的偏差,而只考虑平均数。在这种情况下,我们调用了该方法ContDetApprox公司带输入2τ以确保概率质量平均移动到窗口中心,而不是太靠近边界。对于这种配置,总误差高出几个数量级,例如,对于酶示例的参数集a),总误差为0.0224。

最后,我们测试了算法第7-10行中构造的窗口的大小s窗口.我们更改了算法s窗口通过在第10行和第11行之间将窗口大小减少5%。在这种情况下,总误差η 第页 增加。例如,η 第页 =0.35%,对于酶示例的参数集a)。这些结果证实了滑动窗口的大小和位置使得近似误差较小,而显著较小的窗口导致显著较高的近似误差。

运行时间

对于时间复杂性分析,我们主要关注三个问题。

  • 滑动窗口方法与全局分析:我们将滑动窗口方法在一个步骤中与全局解进行比较,并将其与另一个窗口方法进行比较,其中窗口的大小在必要时增加一倍。

  • 求解方法(均匀化与Krylov子空间方法):In Algorithms窗口,我们通过与Krylov子空间方法交换均匀化来改变求解方法。

  • 时间间隔(等距与自适应时间步长):我们使用不同的方法来确定长度τ j个 算法第3行中的下一时间步s窗口.

滑动窗口法与全局分析

我们使用酶的例子来比较滑动窗口解和全局解(全局均匀化和全局Krylov子空间方法),因为它具有有限的状态空间。注意,所有其他示例都无法使用全局方法求解,因为它们的状态空间是无限的。我们列出了计算(参见公式())使用图中的全局方法6.

图6
图6

有限酶例子的滑动窗口法与全局分析.

观察到全局均匀化方法的总误差较小(与标有错误)因为唯一的误差源是等式中无穷和的截断(13). 在带有标题的列中#状态我们列出了可到达的状态数。在全局求解过程中,我们始终考虑所有可达状态,而在滑动窗口方法中,在一个时间步长内考虑的平均状态数要小得多。这就是滑动窗口方法速度快得多的主要原因。此外,在均匀化的情况下,全局均匀化的速率是所有退出速率中的最大值,而对于局部均匀化,我们取当前窗口中所有状态的最大值。注意,与局部最大值相比,全局最大值可能很大。这解释了全局均匀化方法的糟糕性能。当Krylov子空间方法用于全局解时,全局解的运行时间也高于局部Krylof子空间方法(滑动窗口方法与Krylov-子空间方法相结合)的运行时间。同样,原因是在滑动窗口迭代期间考虑的状态数量较少。此外,矩阵 j个 具有便于使用更大因而更少时间步长的数值属性。用于求解等式的迭代步骤总数(6)与全局Krylov子空间方法相比,滑动窗口方法确实很小(平均步骤少20倍左右)。

现在我们将重点放在滑动窗口方法和另一个局部方法(称为双窗口法对于后者,我们以与Sidje等人类似的方式计算概率向量[21]. 我们从一个初始窗口开始,并应用Krylov算法。我们不迭代时间间隔[t吨j个-1,t吨 j个 )但是使用Krylov子空间方法的步长。在每个时间步之后,我们删除窗口中不用于其余计算的部分。如果错误超过某个阈值,我们将扩展窗口的大小。由于该方法的性能在很大程度上取决于初始窗口和窗口展开的方向,因此我们首先使用与滑动窗口方法相同的窗口,并始终沿对计算最有利的方向展开。为此,我们使用了从滑动窗口方法的实验中获得的关于概率质量移动方向的信息。窗口的扩展是通过将其所有边的长度加倍来实现的。

我们将双窗口方法应用于酶的例子和基因表达。对于我们尝试的所有参数集,滑动窗口方法在运行时间方面优于双窗口方法(平均加速因子为5)。在滑动窗口方法的情况下,Krylov子空间近似的总迭代次数比双窗口方法少13倍(平均值为6.5)。请注意,对于任意系统,如果没有关于系统的额外知识,就无法应用加倍窗口方法,即通常不清楚窗口必须向哪个方向扩展。

我们的结果表明,与全局分析相比,滑动窗口方法实现了显著的加速,也与双窗口方法相比。此外,虽然全局分析仅限于有限状态系统,并且双窗口方法需要有关系统的额外知识,但我们的方法可以应用于概率质量的重要部分位于可控制状态子集的任何系统。如果系统的维数很高,那么概率质量的很大一部分可能位于难以处理的许多状态,在这种情况下,我们算法的内存需求可能会超过可用容量。

解决方法

在滑动窗口迭代过程中,可以在算法的第13行中应用不同的求解方法s窗口我们主要讨论均匀化方法和Krylov子空间方法。图中的运行时间2(比较由标记的列sWindow+均匀化列标记为sWindow+克里洛夫)表明Krylov子空间方法的性能更好(平均加速因子约为1.5)。原因是Krylov子空间方法比均匀化方法对刚度更具鲁棒性。对于非刚性系统,均匀化方法的性能优于Krylov子空间方法[19,39]. 然而,由于生化网络模型通常是僵化的,Krylov子空间方法似乎特别适合于这一领域。

时间间隔

为了确认我们在时间间隔一节中的考虑,我们还使用了等距时间步长的滑动窗口方法。对于所有示例,与使用自适应时间步长(平均加速因子为3.5)相比,使用等距时间步长会导致更长的计算时间。时间步长的自适应选择还有一个优点,即我们可以控制窗口的大小,避免算法的内存需求超过可用容量。

结论

滑动窗口法是解决化学主方程数值算法性能问题的一种新方法。它用一系列局部分析取代了系统的全局分析。该方法适用于各种化学反应系统,包括事先不知道化学物种种群大小上限的系统。该方法与所有现有的求解CME的数值算法兼容,也与其他技术相结合,例如时间尺度分离[26,27],是可能的。

我们通过一些实验证明了我们的方法的有效性。结果是有希望的,因为即使系统具有超过200万个状态且具有显著概率,也可以在可接受的时间内求解。此外,对于比这里介绍的更复杂的示例,通常只考虑状态空间中相对较小的一部分就足够了。细胞中的分子数量总是有限的,通常生化系统只遵循少数不同的趋势。换言之,在生物化学系统中,很少有大量不同的场景具有显著的可能性。因此,我们期望滑动窗口方法能够成功地应用于具有许多化学物种和反应的系统,只要概率质量的重要部分始终位于可控制的状态子集。此外,还可以进行进一步的增强,例如拆分窗口,这对于多平台系统特别有用。此外,我们计划将我们的算法自动化,除了初始条件和反应集之外,不需要用户进一步输入,例如最大化/最小化某些群体的反应组合。

工具书类

  1. Elowitz MB,Levine MJ,Siggia ED,Swain PS:单细胞中的随机基因表达。科学。2002, 297: 1183-1186. 10.1126/科学.1070919

    第条 中国科学院 公共医学 谷歌学者 

  2. Ozbudak EM、Thattai M、Kurtser I、Grossman AD、van Oudenaarden A:单个基因表达中的噪声调节。自然遗传学。2002年,31:69-73。10.1038/ng869

    第条 中国科学院 公共医学 谷歌学者 

  3. Blake WJ、Kaern M、Cantor CR、Collins JJ:真核基因表达中的噪音。自然。2003, 422: 633-637. 10.1038/性质01546

    第条 中国科学院 公共医学 谷歌学者 

  4. Fedoroff N,Fontana W:大分子的小数目。科学。2002, 297: 1129-1131. 10.1126/科学1075988

    第条 中国科学院 公共医学 谷歌学者 

  5. Kierzek A,Zaim J,Zielenkiewicz P:转录和翻译起始频率对原核基因表达随机波动的影响。生物化学杂志。2001, 276 (11): 8165-8172. 10.1074/jbc。M006264200号

    第条 中国科学院 公共医学 谷歌学者 

  6. 保尔森J:总结基因网络中的噪音。自然。2004, 427 (6973): 415-418. 10.1038/性质02257

    第条 中国科学院 公共医学 谷歌学者 

  7. Swain PS,Elowitz MB,Siggia ED:基因表达随机性的内在和外在贡献。美国国家科学院院刊,2002,99(20):12795-12800。10.1073/pnas.162041399。

    第条 中国科学院 谷歌学者 

  8. Turner TE,Schnell S,Burrage K:体内反应建模的随机方法。复合生物化学。2004, 28: 165-178. 10.1016/j.compbiochem.2004.05.001。

    第条 中国科学院 谷歌学者 

  9. 威尔金森DJ:系统生物学随机建模。2006年,查普曼和霍尔,

    谷歌学者 

  10. McAdams HH,Arkin A:这是一个嘈杂的行业!。遗传学趋势。1999, 15 (2): 65-69. 10.1016/S0168-9525(98)01659-X

    第条 中国科学院 公共医学 谷歌学者 

  11. Rao C、Wolf D、Arkin A:细胞内噪声的控制、利用和耐受。自然。2002, 420 (6912): 231-237. 10.1038/自然01258

    第条 中国科学院 公共医学 谷歌学者 

  12. Thattai M,van Oudenaarden A:基因调控网络中的固有噪声。美国国家科学院院刊,2001,98(15):8614-8619。10.1073/pnas.151588598。

    第条 中国科学院 谷歌学者 

  13. McAdams HH,Arkin A:基因表达的随机机制。美国国家科学院院刊,1997年,94:814-819。10.1073/pnas.94.3.814。

    第条 中国科学院 谷歌学者 

  14. Arkin A,Ross J,McAdams HH:噬菌体发育途径分叉的随机动力学分析λ-感染的大肠杆菌细胞。遗传学。1998年,149年:1633-1648年。

    公共医学中心 中国科学院 公共医学 谷歌学者 

  15. Srivastava R,You L,Summers J,Yin J:细胞内病毒动力学的随机与确定性建模。《理论生物学杂志》。2002, 218: 309-321. 2006年10月10日/jtbi.2002.3078

    第条 中国科学院 公共医学 谷歌学者 

  16. Gillespie DT:马尔可夫过程。1992年,学术出版社,

    谷歌学者 

  17. Gillespie DT:耦合化学反应的精确随机模拟。物理化学杂志。1977, 81 (25): 2340-2361. 10.1021/j100540a008。

    第条 中国科学院 谷歌学者 

  18. Gillespie DT:化学反应系统的近似加速随机模拟。化学物理杂志。2001, 115 (4): 1716-1732. 10.1063/1.1378322.

    第条 中国科学院 谷歌学者 

  19. Stewart WJ:马尔可夫链数值解导论。1995年,普林斯顿大学出版社,

    谷歌学者 

  20. Munsky B,Khammash M:求解化学主方程的有限状态投影算法。化学物理杂志。2006, 124: 044144-10.1063/1.2145882.

    第条 谷歌学者 

  21. Burrage K,Hegland M,Macnamara F,Sidje B:一种基于Krylov的有限状态投影算法,用于求解生物系统离散建模中产生的化学主方程。马尔科夫150周年纪念大会的会议记录。编辑:Langville AN,Stewart WJ。2006, 21-38. 博森图书公司,

    谷歌学者 

  22. Sjöberg P:基因和蛋白质随机建模的数值方法。博士论文。2007年,瑞典乌普萨拉大学,

    谷歌学者 

  23. Sjöberg P,Lötstedt P,Elf J:分子生物学中主方程的福克-普朗克近似。科学计算与可视化。2009, 12: 37-50. 10.1007/s00791-006-0045-6。

    第条 谷歌学者 

  24. Hegland M,Burden C,Santoso L,Macnamara S,Booth H:应用于基因调控网络的随机主方程求解器。J计算应用数学。2007, 205: 708-724. 2016年10月10日/j.cam.2006.02.053。

    第条 谷歌学者 

  25. Engblom S:应用于化学主方程的Galerkin光谱法。通信计算物理。2009, 5: 871-896.

    谷歌学者 

  26. Busch H,Sandmann W,Wolf V:酶催化底物转化的数值聚合算法。CMSB程序。2006, 4210: 298-311. LNCS、Springer、,

    谷歌学者 

  27. Peles S,Munsky B,Khammash M:使用时间尺度分离和有限状态投影简化和求解化学主方程。化学物理杂志。2006, 125: 204104- 10.1063/1.2397685

    第条 公共医学 谷歌学者 

  28. Cao Y,Gillespie D,Petzold L:套叠模拟方法的有效步长选择。化学物理杂志。2006, 124 (4): 044109-11. 10.1063/1.2159468

    第条 公共医学 谷歌学者 

  29. 坎彭NGv:物理和化学中的随机过程。2007年,爱思唯尔,3岁,

    谷歌学者 

  30. 《随机过程导论》。1975年,普伦蒂斯·霍尔,

    谷歌学者 

  31. Moler CB,Van Loan CF:计算矩阵指数的十九种可疑方法。SIAM评论。1978, 20 (4): 801-836. 10.1137/1020098.

    第条 谷歌学者 

  32. Grassmann WK,:计算概率。2000年,Kluwer学术出版社,

    谷歌学者 

  33. Sidje R,Stewart W:马尔可夫链中产生的大型稀疏矩阵指数的计算方法综述。马尔可夫链,计算统计和数据分析29。1996, 345-368.

    谷歌学者 

  34. Jensen A:Markoff链,用于研究Markoff过程。斯堪的纳维亚半岛。1953, 36: 87-91.

    谷歌学者 

  35. Gross D,Miller D:作为瞬态马尔可夫过程建模工具和求解程序的随机化技术。运营研究。1984, 32 (2): 926-944. 10.1287/opre.32.2343。

    第条 谷歌学者 

  36. Philippe B,Sidje R:基于Krylov子空间的马尔可夫过程的瞬态解。马尔可夫链数值解第二届国际研讨会会议记录。1995, 95-119. Kluwer学术出版社,

    谷歌学者 

  37. Hairer E,Norsett S,Wanner G:求解常微分方程I:非刚性问题。2008年,施普林格,

    谷歌学者 

  38. Hairer E,Wanner G:求解常微分方程II。2004,刚性和微分代数问题Springer,

    谷歌学者 

  39. Reibman A,Trivedi K:马尔可夫模型的数值瞬态分析。《计算运营研究》,1988年,15:19-36。10.1016/0305-0548(88)90026-3.

    第条 谷歌学者 

  40. Zhang J,Watson LT,Cao Y:化学主方程解的改进均匀化方法。技术代表TR-07-31,《计算机科学》,弗吉尼亚理工大学,2007年,

    谷歌学者 

  41. Hellander A:基于均匀化和拟蒙特卡罗的化学主方程瞬态解的有效计算。化学物理杂志。2008, 128 (15): 154109- 10.1063/1.2897976

    第条 公共医学 谷歌学者 

  42. Sidje R,Burrage K,MacNamara S:计算马尔可夫链瞬态分布的非精确均匀化方法。SIAM科学计算杂志。2007, 29 (6): 2562-2580. 10.1137/060662629.

    第条 谷歌学者 

  43. de Souza e Silva e,Gail R:马尔可夫链的瞬态解。计算概率。编辑:格拉斯曼WK。2000, 43-79. Kluwer学术出版社,

    第章 谷歌学者 

  44. Fox BL,Glynn PW:计算泊松概率。ACM通信。1988, 31 (4): 440-445. 10.1145/42404.42409。

    第条 谷歌学者 

  45. Dunkel J,Stahl H:关于刚性马尔可夫链的瞬态分析。第三届IFIP关键应用可靠计算工作会议纪要。1993, 137-160.

    第章 谷歌学者 

  46. Gallopoulos E,Saad Y:关于抛物方程的并行解。程序。ACM SIGARCH-89。1989年,17-28。ACM压机,

    谷歌学者 

  47. Saad Y:分析矩阵指数算子的一些Krylov子空间近似。SIAM J数字分析。1992, 29: 209-228. 10.1137/0729014.

    第条 谷歌学者 

  48. Sidje RB:EXPOKIT:计算矩阵指数的软件包。ACM数学软件汇刊。1998, 24: 130-156. 10.1145/285861.285868.

    第条 谷歌学者 

  49. 贝克G:Padé近似法的要点。1975年,纽约学术出版社,

    谷歌学者 

  50. Goutsias J:随机生化系统中快速反应动力学的准平衡近似。化学物理杂志。2005, 122 (18): 184102- 10.1063/1.1889434

    第条 公共医学 谷歌学者 

  51. Gardner T,Cantor C,Collins J:大肠杆菌中基因切换开关的构建。自然。2000, 403: 339-342. 10.1038/35002131

    第条 中国科学院 公共医学 谷歌学者 

  52. Didier F,Henzinger TA,Mateescu M,Wolf V:噪声细胞过程中事件概率的近似。程序。CMSB的。2009年,5688:173-LNBI,

    谷歌学者 

  53. Ferm L,Lötstedt P,Hellander A:按尺寸参数缩放的主方程近似层次。科学计算杂志。2008, 34: 127-151. 2007年10月10日/10915-007-9179-z。

    第条 谷歌学者 

  54. Henzinger T,Mateescu M,Wolf V:无限马尔可夫链的滑动窗口抽象。程序CAV。2009, 5643: 337-352. LNCS、Springer、,

    谷歌学者 

下载参考资料

致谢

这项研究的部分资金由瑞士国家科学基金会(205321-111840)和萨尔州大学多模计算与交互卓越集群(Cluster of Excellence on Multimodal Computing and Interaction at Saarland University)提供。这篇论文的初步版本出现在《国际计算机辅助验证会议记录》上[54].

作者信息

作者和附属机构

作者

通讯作者

与的通信维雷娜·沃尔夫.

其他信息

作者的贡献

大众汽车和TAH设计了这项研究。VW、RG、MM和TAH开发了该算法,由RG和MM执行。VW、MM和TA编写了手稿,所有作者都阅读并批准了该手稿。

作者提交的原始图像文件

权利和权限

本文由BioMed Central Ltd.授权发布。这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/2.0),允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用了原作。

转载和许可

关于本文

引用这篇文章

沃尔夫,V.,戈尔,R.,马泰斯库,M。等。使用滑动窗口求解化学主方程。BMC系统生物 4, 42 (2010). https://doi.org/10.1186/1752-0509-442

下载引文

  • 收到:

  • 认可的:

  • 已发布:

  • 内政部:https://doi.org/10.1186/1752-0509-442

关键词