Solving the chemical master equation using sliding windows

Wolf, Verena; Goel, Rushil; Mateescu, Maria; Henzinger, Thomas A

doi:10.1186/1752-0509-4-42

研究文章
开放式访问
出版：2010年4月8日

用滑动窗口求解化学主方程

BMC系统生物学 体积 4，物品编号：42(2010)引用这篇文章

61引文
韵律学细节

摘要

背景

化学主方程（CME）是一个常微分方程系统，它将化学反应网络的演化描述为一个随机过程。其解产生系统在每个时间点的概率密度向量。在许多情况下，数值求解CME的计算成本很高，甚至不可行，因为可达状态的数量可能非常大或无限。我们引入了滑动窗口方法，该方法通过执行一系列局部分析步骤来计算CME的近似解。在每个步骤中，只考虑一个可管理的状态子集，表示进入状态空间的“窗口”。在随后的步骤中，窗口遵循概率质量移动的方向，直到感兴趣的时间段过去。我们通过估计化学物种种群的上下限，基于对系统未来行为的确定性近似来构造窗口。

结果

为了证明我们的方法的有效性，我们将其应用于文献中前面描述的几个示例。实验结果表明，与全局分析相比，所提出的方法大大加快了分析速度，同时仍然提供了高精度。

结论

滑动窗方法是解决化学主方程数值算法性能问题的一种新方法。该方法有效地近似了各种化学反应系统在感兴趣的时间点的概率分布，包括事先不知道化学物种种群大小上限的系统。

背景

实验研究报告了细胞过程中随机机制的存在[1–9]因此，在过去十年中，随机性在系统生物学中受到了广泛关注[10–15]. 随机特性的研究要求计算模型考虑化学反应的固有随机性。随机动力学方法可能会产生与确定性模型预测的动力学显著不同的动力学，因为系统可能会遵循具有非零可能性的非常不同的场景。

假设系统在空间上是均匀的，并且具有固定的体积和温度，在每个时间点，生化反应网络的状态由所涉及的化学物种的种群向量给出。系统的时间演化可以用马尔可夫过程来描述[16]，通常表示为常微分方程（ODE）系统，称为化学主方程（CME）。

CME可以通过应用数值解算法进行分析，或者间接地通过生成潜在马尔可夫过程的轨迹进行分析，这是Gillespie的基础随机模拟算法[17,18]. 在前一种情况下，这些方法通常基于马尔可夫过程的矩阵描述，因此主要受系统大小的限制。Stewart对离散状态Markov过程数值分析的最成熟方法进行了综述和比较[19]. 这些方法计算马尔可夫过程在若干时间点的概率密度向量，达到先验指定的精度。如果可以应用数值求解算法，那么它们所需的计算时间几乎总是比随机模拟少得多，而随机模拟只给出感兴趣的度量值的估计。如果不仅用随机模拟估计状态变量的均值和方差，而且还估计某些事件的概率，则情况尤其如此。然而，对于许多实际系统，可达状态的数量是巨大的，甚至是无限的，在这种情况下，数值求解算法可能不适用。这主要取决于化学物质的数量。在低维（例如<10）中，可以直接求解CME，而在高维中，随机模拟是唯一的选择。在随机模拟的情况下，一旦轨迹的数量足够大，可以获得感兴趣的度量的估计值，以达到所需的统计精度。然而，模拟求解技术的主要缺点是需要大量的轨迹才能获得可靠的结果。例如，为了将估计的置信区间减半，必须生成四倍以上的轨迹。因此，随机模拟通常只有在对结果准确性的置信度很低的情况下才可行。

在本文中，我们缓解了CME数值求解算法的性能问题。我们没有对状态空间进行全局分析，而是提出了滑动窗法，包括一系列对状态空间重要部分的局部分析。在序列的每一步中，我们动态地选择一个时间间隔，并计算一个可管理的可达状态子集的近似数值解。为了确定在特定时间段内相关的状态，对于每个化学物种，我们估计了种群大小的上限和下限。这就产生了一个“窗口”的边界，其中大多数概率质量在感兴趣的时间间隔内保持不变。如图所示1当以逐步方式分析系统时，窗口在状态空间中“滑动”。在每一步中，初始条件由概率向量给出（其支持用浅灰色表示），并构造矩阵来描述马尔可夫过程中窗口（用虚线矩形表示）当前所在的部分。然后使用标准数值算法求解相应的ODE，并获得下一个向量（以深灰色表示）。

我们重点介绍两种特定的数值求解方法均匀化方法和Krylov子空间方法我们比较了它们用于求解滑动窗口迭代过程中出现的ODE时的效率。我们还将滑动窗口方法与以全局方式应用的数值算法进行了比较，即对于可控制大小的系统，对所有可达状态（不仅是窗口状态）进行了比较。我们感兴趣的是马尔可夫过程的概率分布，而不仅仅是均值和方差。这些概率很难用随机模拟来准确估计。因此，我们仅将滑动窗口方法获得的解与数值解算法进行比较，而不与随机模拟进行比较。

最近，有限状态投影算法已经提出了解决CME的（FSP算法）[20,21]. 它们与我们的方法不同，因为它们完全基于底层图的结构，而滑动窗口方法基于马尔可夫过程的随机特性。FSP算法从初始投影开始，如有必要，可以扩展初始投影的大小。扩展的方向和大小是基于对系统的定性分析，以宽度优先搜索的方式选择的。目前尚不清楚为了在下一时间步中捕获大部分概率质量，状态空间需要探索多远。因此，如果投影尺寸太小，则必须使用扩展投影重复计算。此外，对于大多数模型，概率质量的主要部分在状态空间中的位置遵循一定的方向，而展开是在所有方向上进行的。因此，执行了不必要的计算，因为投影包含访问概率很小的状态。相比之下，在滑动窗口方法中，我们根据反应倾向和时间步长确定下一个计算步骤的概率质量的位置和方向。我们获得的投影明显小于FSP中使用的投影，而我们方法的精度与FSP的精度类似。通过这种方式，我们节省了大量内存和计算量，因为与计算窗口的概率分布相比，我们的窗口构造的时间复杂度很小。在我们的模拟中，我们从不需要使用较大的窗口重复计算概率。

福克-普朗克方程是CME的近似，可以有效地获得其解[22,23]. 然而，这种近似并没有考虑到系统的离散性，而是通过假设一个连续的状态空间改变了基础模型。其他近似CME定义的概率分布的方法基于稀疏网格方法[24]，光谱法[25]或时间尺度的分离[26,27]. 后一种方法使用化学物质子集的准静态假设，并计算系统抽象模型的解。相反，我们提出了一种计算CME直接解的算法。我们的方法也与套叠技术有关[18,28]，因为它们需要估计化学物种种群大小的上下限，就像我们的方法一样。这个时间跳跃必须足够小，以使种群向量的变化不会显著影响系统的动力学。在预测动态选择的时间段内的未来动态时，我们的方法不同于跳跃的计算。更准确地说，我们确定下一个时间步的长度，同时近似处理未来的行为。

在这里，我们更详细地介绍了滑动窗口方法，并对均匀化和Krylov子空间方法的窗口解进行了额外的比较。此外，我们改进了算法的实现，并在更多示例上进行了评估，例如详细报道的双稳态切换开关。

本文的其余部分组织如下。我们首先在背景部分描述建模方法的理论框架。在结果部分，我们介绍了滑动窗口方法和CME的数值求解方法。实验结果在章节结果的末尾给出。

随机模型

我们将生化反应网络建模为从随机化学反应动力学导出的马尔可夫过程[16,29]. Gillespie为耦合化学反应的Markovian模型提供了物理证明[17]. 我们考虑一个固定的反应体积n个空间上均匀且处于热平衡的不同化学物种。系统的状态由向量给出x个 ∈ ，其中我-第个条目，表示为x个_我描述类型的分子数我我们假设分子随机碰撞，化学反应在随机时间发生。由R（右）₁, ...,R（右）_k个，我们表示不同类型的化学反应，每种类型R（右）_米,米 ∈{1, ...,k个}，我们将倾向函数α_米:→ℝ_≥0.倾向函数的形式为

(1)

哪里c（c）_米>0是一个常量我_我是类型的分子数我被类型的反应消耗的R（右）_米.倾向α_米(x个)决定反应的“速度”R（右）_米在里面x个，如下所述。请注意等于所有不同反应物组合的数量。除了倾向函数外，我们还将变化向量v^(米)∈ ℤ^n个具有R（右）_米描述了反应类型的影响R（右）_米.如果x个是当前状态α_米(x个)>0则x个+v（v）^(米)是类型为的反应后系统的状态R（右）_米。请注意α_米(x个)>0表示x个+v（v）^(米)不包含负条目。

我们用以下公式表示系统的初始状态年 ∈ 并定义S公司 ⊆ 作为所有状态的集合，可以从年通过任意数量的反应，即，S公司是的最小子集这样的话年 ∈ S公司和x’ ∈ S公司如果存在米 ∈{1, ...,k个}和x个 ∈ S公司具有α_米(x个)>0和x个+v（v）^(米)=x’。请注意S公司是可数的，但可能是无限的。

示例1 我们描述了酶催化底物转化通过三个反应R₁:E类+S公司→锿,R（右）₂:锿→E类+S公司,R（右）_三:锿→E类+该网络包括四种化学物质，即酶（E）、底物（S）、复合物（ES）和产物（P）分子。变化矢量为v⁽¹⁾= (-1, -1, 1, 0),v（v）⁽²⁾= (1, 1, -1, 0),和v⁽³⁾= (1, 0, -1, 1)。对于(x个₁,x个₂,x个_三,x个₄)∈ ,倾向函数是

如上所述，从初始状态y可以到达的状态集= (年₁,年₂,年_三,年₄)是有限的，因为守恒定律y₁=x个₁+x个_三和y₂=x个₂+x个_三+x个₄，其中我们假设y_三=年₄= 0.

示例2 我们考虑一个基因表达模型[12],它涉及两种化学物质，即mRNA（M）和蛋白质（P）。通过反应R模拟基因转录到mRNA₁:∅→M、通过R将mRNA翻译成蛋白质₂:M（M）→M（M）+P、 R降解mRNA_三:M（M）→∅和R降解蛋白质₄:P（P）→∅.状态是一对(x个_M（M）,x个_P（P）)∈ .如果我们假设最初系统中没有mRNA分子和蛋白质，即y= (0, 0),然后是S=因此是无限的。倾向函数为

化学主方程

我们定义了一个时间齐次的规则马尔可夫过程[30]（CTMC）(X（X）(t吨),t吨 ∈ ℝ_≥0)具有状态空间S公司 ⊆ 。我们假设X（X）由化学反应触发。让年是的初始状态X（X），这意味着公共关系(X（X）（0）=年) = 1. 我们假设反应的概率R（右）_米发生在下一个无穷小的时间间隔[t吨,t吨+τ),τ>0由给定

对于x个 ∈ S公司我们定义的概率是X（X）处于状态x个时间t吨通过对^(t吨)(x个)=公共关系(X（X）(t吨)=x个|X（X）(0) =年). 这个化学主方程（CME）描述了X（X）通过微分方程[29]

(2)

在续集中，对方程(2)更有利。它是通过定义无穷小生成矩阵Q= (问(x个,x’))_{x个,x’∈S公司}CTMC的X（X）通过

其中我们假设状态空间的固定枚举。注意（可能无限）矩阵的行和问为零，并且λ_x个= -问(x个,x个)，的退出率州的x个，是平均停留时间的倒数x个.

让T型^（0）等于单位矩阵我、和，用于τ>0，让T型^(τ)是步骤的转移概率矩阵τ包含个条目T型^(τ)(x个,z（z）)=公共关系(X（X）(t吨+τ)=z（z）|X（X）(t吨)=x个). 的元素T型^(τ)是可微的并且问是的导数T型^(τ)在τ= 0. 如果问给出了，并且X（X）被认为是有规律的，T型^(τ)由Kolmogorov向后和向前方程

(3)

使用一般解决方案T型^(τ)=e（电子）^Qτ.让对^(t吨)是包含条目的行向量对^(t吨)(x个)的x个 ∈ S公司那么CME的矢量形式是

(4)

如果支持_{x个∈S公司}λ_x个<∞，等式(4)具有通用解决方案

(5)

其中矩阵指数由e（电子）^{Qt（数量）}=.

在续集中，我们将利用以下事实：{T型^(τ)|τ≥0}是一个过渡半群并满足Chapman-Kolmogorov方程[30]为所有人τ₁,τ₂≥ 0. 让t吨₀, ...,t吨_第页∈ ℝ_≥0是这样的t吨₀<⋯<t吨_第页然后，

（6）

这意味着，对于t吨₀=0和t吨_第页=t吨，我们获得对^(t吨)通过等式中的迭代方案(三)的t吨₁-t吨₀,t吨₂-t吨₁, ...,t吨_第页-t吨_第页-1.

如果状态空间是无限的，我们只能计算对^(t吨).但即使问是有限的，有几个因素会妨碍方程中矩阵指数的有效求解(5). 首先，矩阵的大小问可能会很大，因为它随着状态变量的数量呈指数增长。然而，通常问是稀疏的，因为反应类型的数量与状态的数量相比很小。但即使在问稀疏通常只有近似解才能有效计算。将无穷和中足够多的项相加数值不稳定，如问包含严格的正负条目，导致严重的舍入错误[31]. 对于等式形式的一阶线性方程组，存在各种数值求解方法(4). 然而，它们中的许多并没有用处，因为它们没有保留问.文献中存在一些调查和比较[19,32,33]. 最流行的是基于均匀化的方法[34,35]Krylov子空间中的近似[36]，或数值积分[37,38]. 我们将在数值求解方法一节中更详细地描述前两种方法。

结果

滑动窗法

本文提出的算法的核心思想是计算近似值属于对^(t吨)以迭代方式，如等式(6). 更准确地说，我们计算一系列近似值这样对于子集W公司_j个状态空间的，j个 ∈{1, ...,第页},为所有人x个 ∈ W公司_j个.集合W公司₁, ...,W公司_第页被称为窗户，我们假设W公司_j个包含时间间隔内概率质量（大部分）集中的状态[t吨_j个-1,t吨_j个). 我们讨论窗户的构造W公司_j个稍后。

让问_j个是指的矩阵W公司_j个，即我们定义问_j个(x个,x’)=问(x个,x’)如果x个,x’ ∈ W公司_j个、和问_j个(x个,x’)否则=0。注意，为了演示的简单性，我们保留了一个固定的枚举S公司并假设每个问_j个大小与相同问然而，该方法的实现仅考虑问_j个包含中的状态条目W公司_j个。对于τ_j个=t吨_j个-t吨_j个-1，我们定义

(7)

哪里= (1_年)^T型和D类_j个是对角线矩阵，其主要对角线项为x个 ∈ W公司_j个否则为零。行向量(1_年)^T型位置处有一个年否则为零。

在j个-第步，矩阵包含入住的可能性τ_j个时间单位在W公司_j个从一个国家到另一个国家。作为初始概率，公式(7)使用近似值适用于所有州x个 ∈ W公司_j个对角矩阵确保概率质量位于W公司_j个-1\W公司_j个在计算过程中忽略，即仅忽略交点的元素W公司_j个-1∩W公司_j个向量中可以有非零项D类_j个。这是必要的，因为问_j个不包含以外状态的转换速率W公司_j个（这些状态很吸引人）。直观地，向量描述了概率质量在内部移动后的位置W公司_j个.

尽管问_j个不是CTMC的发电机，等式(7)对所有状态都有一个简单的解释x个 ∈ W公司_j个.让我们修复j个现在，让CTMC与…相同X（X），除了所有州x’ ∉ W公司_j个正在吸收（即一次x’已到达，无法离开）。让初始概率分布是这样的为所有人x个 ∈ W公司_j个。那么，对于所有人x个 ∈ W公司_j个.面向所有人j个，向量是次随机的，并且在每个步骤中其条目的总和都会减少，即，

概率质量“丢失”，因为我们不考虑条目对于x个 ∈ W公司_j个-1\W公司_j个，当我们与相乘时D类_j个此外，我们失去了离开的可能性W公司_j个在下一个τ_j个时间单位，因为是一个超突变矩阵。如果j个，在时间间隔内[t吨_j个-1,t吨_j个)大部分概率质量保持在W公司_j个，然后是近似误差对所有人来说都很小x个 ∈ S公司.之后损失的概率质量j个近似产生的步长由下式给出

(8)

因此，如果公式(7)精确求解后，滑动窗方法的总近似误差为η_第页注意，公式(8)是矢量所有分量的误差之和.

窗户构造

在迭代的每个步骤中，窗口W公司_j个必须选择错误η_j个保持较小。如果是这样的话W公司_j个满足以下条件：（a）具有足够高的概率X（X）(t吨_j个-1)∈ W公司_j个，（b）离开的概率W公司_j个在时间间隔内[t吨_j个-1,t吨_j个)足够小。

要求（a）意味着W公司_j个包含支持也就是说，一个子集S公司_j个⊂ S公司这样的话很小。在第一步中，我们设置S公司₁= {年}。对于j个>1、窗户W公司_j个在之后构造已计算。我们修了一个小δ>0并选择S公司_j个= {x个|>δ}。如果支持较大且几乎均匀分布，可能需要构造S公司_j个这样的话小于某个固定阈值。然而，我们的实验结果表明，使用固定阈值会产生良好的结果，这使得对支持度进行排序的额外工作在实践中是不必要的。注意，要求（a）意味着W公司_j个和W公司_j个-1横断。因此，在每一步中，我们都会沿着概率质量移动的方向“滑动”窗口。

本节的后续部分重点讨论需求（b），其中有必要预测流程的未来行为。找到集合的一种可能性W公司_j个满足要求的是对t吨_j个-t吨_j个-1初始状态为的时间单位S公司_j个。如果我们的目标是获得准确的近似值，那么这可能会很昂贵。大多数模拟运行与系统的平均行为相对应。然而，有些事件可能不太频繁，但仍有很大的可能性。因此，我们提出了一种依赖于状态控制确定性近似的思想，即给定初始状态z（z） ∈ S公司_j个，估计每个状态变量在下一个期间可以采用的最大值和最小值τ_j个=t吨_j个-t吨_j个-1时间单位。更确切地说，对于每个维度d日 ∈{1, 2, ...,n个}，我们计算值, ∈ ℤ这样的话

很小，其中X（X）_d日(τ)是d日-随机向量的第个分量X（X）(τ).

极值的计算,在几个州执行z（z）都是随机选择的。我们的实验结果表明，当考虑10个以上的状态时，我们的结果的准确性没有提高。让A类_j个⊆ S公司_j个是随机状态的集合。通过计算和，我们得到了时间间隔内每个状态变量的最大值和最小值的估计[t吨_j个-1,t吨_j个)在以下条件下X（X）(t吨_j个-1)∈ S公司_j个.窗口W公司_j个现在被构造为S公司_j个以及其中的所有状态和也就是说，W公司_j个等于

(9)

对于固定状态z（z） ∈ A类_j个我们利用马尔可夫链的规则结构来计算和.我们从状态开始z（z）并逐个更新状态变量。我们假设在很短的时间间隔Δ内，反应类型的速率R（右）_米保持不变，即等于α_米(z（z）). 然后是R（右）_米-下一个Δ时间单位内的跃迁是带参数的泊松分布α_米(z（z）)Δ. 我们可以通过预期来近似这个数字α_米(z（z）)泊松分布的Δ。注意，上述假设是有根据的，因为在耦合化学反应的情况下，倾向α_米(x个)在x个，如果只考虑基本反应，即对应于单个机械步骤的反应，因此最多有两个反应物。一般来说，反应可能有中间产物和/或平行反应路径。然而，它们总是可以分解为基本反应。由于我们对上限和下限感兴趣，我们还考虑了标准偏差泊松分布。我们假设，如果当前状态为x个，在Δ时间单位内

至少,
至多

类型转换R（右）_米被带走了。注意，例如，α_米(z（z）)Δ=1，则我们有91.97%的置信度，即反应的实际数量位于区间内

(10)

让κ_米∈ 和我= 0, 1,.... 迭代

(11)

产生连续确定的最坏情况近似X（X）(t吨+ Δ),X（X）(t吨+ 2Δ),... 在以下条件下X（X）(t吨)=z（z）.对于函数α_米在状态变量中增长极快的情况下，迭代可能会产生错误的近似值，因为它基于这样的假设，即在[0，Δ）期间倾向是恒定的。

在生化反应网络的背景下，α_米最多是二次的，因此公式(11)产生足够的结果。对于给定的系统，我们执行等式中的近似(11)对于所有可能的组合。可以跳过优先处理导致状态空间中相反方向的转换类型的组合，因为它们不会给出最坏情况边界。例如，考虑示例（1）c（c）₁=c（c）₂=c（c）_三= 1,z（z）=（10，10，100，0），Δ=0.01。如果我们假设更多类型的反应R（右）₂和R（右）_三发生（比平均值少）R（右）₁，我们得到、和这意味着复杂分子的数量减少x个⁽¹⁾= (14,12, 96, 2). 我们可以省略包含这两者的组合和.作为R（右）₁等同R（右）₂反之亦然，这些组合不会产生状态变量极值的良好近似值。一般来说，反应网络的依赖关系图可能有助于识别那些最大化特定人群的组合（另请参阅实验结果部分）。

在续集中，每个选择的组合都被称为分支因为，对于固定z（z），相应的迭代导致不同的后续x个^(我+1）请注意，对于特定分支米 ∈{1, ...,k个}我们修复κ_米=，或κ_米=为所有人我。迭代在以下时间结束⌈τ_j个/Δ⌉步长（其中最后一个时间步长是余数而不是Δ），以及极值和由迭代期间状态变量的最小值和最大值给出。更具体地说，和，其中1≤d日≤n个,x个^(我)=、和z（z）=x个^（0）.

计算和在表中的伪代码中进行了描述1（左栏），调用ContDetApprox公司。注意上标我指的是当前分支，而不是等式中的迭代(11)这在第19行中执行。分支数量为2n个因为每个维度的最大值和最小值都是必要的。在第17行中，我们根据当前分支决定我，是否κ_米设置为，或.

表1方法ContDetApprox公司（左）和主程序s窗口（右）

全尺寸桌子

关于时间步长Δ的选择，我们建议动态选择Δ，以便米等式中的间隔(10)至少涵盖了相应泊松分布概率质量的80%。显然，在更大的区间覆盖更多概率质量的情况下，该方法的准确性会提高。对于我们的实验结果，我们选择Δ，以便λ_x个·Δ=1产生了足够准确的结果。

滑动窗口算法

在表的右栏中1我们描述了称为s窗口，以伪代码表示。第2-14行中的for循环实现了通过连续计算向量对_j个从对_j个-1输入ϵ是第13行中ODE的解引起的总近似误差的界。阵列t吨包含时间实例t吨₀, ...,t吨_第页对于我们的实验结果，我们比较了下面解释的两种不同的时间步进机制。参数δ是用于删除这些状态以支持对_j个-1概率小于δ。我们定义S公司_j个作为所有状态的集合x个为此对_j个-1(x个)大于δ在第4行中。请注意，对于j个=1组S公司₁仅包含初始状态年.在第6行中，兰特(S公司_j个,国家数量)返回一组状态数随机元素来自S公司_j个用于构造向量的b条⁺和b条^-在第7-10行中。窗口中所有状态的速率条目W公司_j个（参见公式(9))在第11行中计算，所有剩余条目问_j个设置为零。第13行调用了一个求解方法来计算对_j个从对_j个-1例如，这可以是均匀化方法、ODE解算器或基于Krylov子空间近似的方法。我们经过了一段时间τ_j个和相应的分数近似误差。

我们可以从输出中计算概率质量的总损失对_第页通过η_第页= 1 - ∑_x个对_第页(x个). 该值包括算法的两个近似误差：（1）离开窗口的概率W公司_j个在时间间隔内[t吨_j个-1,t吨_j个)（2）概率这是由于窗口滑动而丢失的，通过与乘法得到D类_j个（参见公式(7)).

请注意，为了提高获得的精度，始终可以重复计算步骤。更准确地说，我们可以通过增加等式中区间的置信度来确定更大的窗口(10)即，通过选择时间步长Δ米类型转换的最大/最小数目R（右）_米存在于具有一定置信度的区间内（例如，置信度为80%）。然而，对于我们的实验结果，我们没有重复任何计算步骤，因为我们总是获得足够准确的结果。

时间间隔

对于我们的实验结果，我们比较了算法的两种不同的时间步进机制s窗口（见表1，右侧）。我们要么选择等距的时间步长τ_j个=τ，对于所有人j个，或者我们决定τ_j个在窗户施工期间W公司_j个（自适应时间步长）。后一种方法产生更快的运行时间。根据系统的动力学，长时间步长可能会导致三个问题：（1）窗口大，矩阵大问_j个可能超过工作记忆容量，（2）在长时间步长内，系统的动态可能会有很大差异问_j个（3）该窗口可能包含仅在更短的时间间隔内有效的状态。另一方面，如果时间步长太小，则必须执行主循环的多次迭代，直到算法终止。窗口几乎完全重叠，尽管每个步骤可能只需要很少的时间，但整个过程的计算成本可能很高。一种可能性是固定窗口的大小并相应地选择时间步长。但这也不一定导致算法运行时间短。原因是，求解方法的时间复杂度不仅取决于表示窗口的矩阵的大小，还取决于其数学特性。

通过计算可以避免上述问题τ₁, ...,τ_第页窗户施工期间W公司_j个如下所示。我们计算了当时重要的状态数t吨_j个-1并将其传递给ContDetApprox公司第9行（见表1). 我们在Algorithm中运行while循环ContDetApprox公司（见表1，left）直到（1）窗口至少有一定的大小，并且（2）窗口中的状态数超过当时有效状态数的两倍t吨_j个-1第一个条件确保窗口超过某个最小大小，例如500个州。第二个条件确保新窗口刚好足够大，可以将概率质量移动到S公司_j个更准确地说，它确保了S公司₁,S公司₂,...不重叠，且后续集合相邻（如图所示1). 请注意，这可以确保生成的窗口不包含许多仅在更短的时间间隔内有效的状态。

while-lop终止时，我们传递变量的值时间从ContDetApprox公司到s窗口并设置τ_j个价值时间显然，在s窗口我们添加了一个表示到目前为止经过的时间的变量，第2行中的for循环被替换为while循环，该循环在经过的时间超过时停止t吨随后，我们给出了滑动窗口方法的实验结果，其中我们以上述方式使用自适应时间步长。

数值求解方法

在本节中，我们介绍了两种数值求解算法的理论基础，即均匀化方法和Krylov子空间方法。我们近似CME的全局解（参见方程(5))以及算法第13行中要求的局部解决方案s窗口（另请参见等式(7)).

均匀化

均匀化方法可以追溯到Jensen[34]也称为Jensen方法、随机化或离散时间转换。在计算机系统的性能分析中，这种方法很受欢迎，并且通常优于其他方法，如Krylov子空间方法和数值积分方法[19,39]. 最近，均匀化也被用于求解CME[40–42].

全局均匀化

让(X（X）(t吨),t吨 ∈ ℝ_≥0)是有限状态空间的CTMCS公司一致化的基本思想是定义离散时间马尔可夫链（DTMC）和泊松过程。DTMC随机地与X（X），这意味着如果步数在[0，t吨)给出，泊松过程跟踪时间，如下所述。

回想一下λ_x个是国家的退出率x个 ∈ S公司、和我是单位矩阵。我们定义了一个均匀化率λ这样的话λ≥最大值_{x个∈S公司}λ_x个并构造，DTMC的转移矩阵X（X）注意P（P）定义自循环概率1-λ_x个/λ一个州的x个，当且仅当λ>λ_x个。对于k个≥1，随机矩阵P（P）^k个包含k个-阶跃转移概率，如果对^（0）是初始分布X（X），向量周^(k个)=对^（0）P（P）^k个包含之后的状态概率k个DTMC中的步骤。时间间隔[0，t吨)具有带参数的泊松分布λt即。，

（12）

现在，方程(5)可以重写为[19,32,43]

(13)

等式(13)与等式相比，具有良好的性能(5). 没有涉及负面指控，因为P（P）是一个随机矩阵，并且λ> 0. 此外，周^(k个)可以通过以下公式进行归纳计算

（14）

如果P（P）稀疏，周^(k个)即使状态空间的大小很大，也可以有效地进行计算。求和下限和上限L（左）和单位可以获得每个状态的x个截断误差[44]

(15)

可以是预先定义的误差容限ϵ>0的先验界。因此，对^(t吨)可以通过以下公式以任意精度逼近

(16)

只要所需的汇总数量不是特别大。

时间复杂性和刚度

作为λt使泊松分布变平，左截断点变大L（左）在等式中(16)在中线性增长λt，而有效泊松概率项的数量为[44]O（运行）(). 如果向量周^(L（左）),周^{(L（左）+1)}, ...,周^(单位)使用以下公式计算单位矩阵-向量乘法（参见公式(14))，则均匀化过程的复杂性为O（运行）(νλt)其中ν是中非零元素的数量P（P）.

如果基础模型为僵硬的在刚性模型中，底层系统的组件在不同数量级的时间尺度上运行，这在各种应用领域中都会出现，尤其是在系统生物学中。对于刚性模型，均匀化率λ≥最大值_{x个∈S公司}λ_x个将对应于最快的时间刻度。相比之下，只有在对应于最慢时间尺度的一段时间内，才能观察到缓慢分量的显著变化。因此，均匀化方法非常耗时，因为刚度指数[45]t吨·最大值_{x个∈S公司}λ_x个.

在后续部分中，我们展示了如何以局部方式应用均匀化，从而使刚度对该方法的性能产生较少的负面影响。换句话说，滑动窗口技术使均匀化即使对于刚性系统也能表现良好。

局部均匀化

我们现在结合了均匀化和滑动窗口方法。假设S公司可能是无限的，我们迭代地应用均匀化来求解方程(7). 更具体地说，在Algorithm的第13行s窗口（见表1，右），我们调用均匀化方法来近似

因此，P（P）_j个=我+是次随机转换矩阵，其中λ_j个=.使用与等式相同的计算(16)，我们得到了一个亚稳态矢量

(17)

哪里L（左）和单位截断点取决于λ_j个τ_j个、和此外，作为λ_j个仅取决于W公司_j个，均匀化率通常小于全局均匀化率sup_{x个∈S公司}λ_x个，这意味着等式中所需的项更少(17)比等式中的(16).

整个过程的计算复杂性为O（运行）()，因此，与全局均匀化相比，如果，其中λ=支持_{x个∈S公司}λ_x个和ν_j个是中非零元素的数量P（P）_j个.

Krylov子空间

Krylov子空间方法广泛用于大型特征值问题、线性方程组的求解以及矩阵指数和向量乘积的近似[46,47]. 我们对后一种近似方法感兴趣，并展示了它如何用于求解CME，无论是以全局方式还是与滑动窗口方法相结合。最近，Sidje等人将Krylov子空间方法应用于CME[21].

全局Krylov子空间方法

回想一下，CME的全局解决方案如下所示对^(t吨)=对^（0）e（电子）^{Qt（数量）}在续集中，我们描述了e（电子）^助教v（v），其中A类是一个N个×N个平方矩阵和v（v）是长度的列向量N个。我们得到了近似值对^(t吨)通过选择A类= (问)^T型和v（v）= (对^（0）)^T型首先让我们假设t吨= 1. 其主要思想是生成米-th Krylov子空间

并寻求近似解e（电子）^A类v（v）从这个子空间。让q个^最小值是最低次的非零一元多项式，如下所示q个^最小值(A类)v（v）= 0. 我们选择米 ∈ ℕ这样q个^最小值大于或等于米在这种情况下，向量v（v）,A类 v（v）, ...,A类^米-1v（v）线性独立，对于每个元素x个∈ K_米存在一个多项式q个最多度米-1和x个=q个(A类)v（v）注意，在实践中，我们选择米=30或米=20，因为q个^最小值通常大于30。然而，如果没有，问题可以解决确切地在中d日-第个Krylov子空间，其中d日是的度数q个^最小值.直接与基础合作{v（v）,A类 v（v）, ...,A类^米-1v（v）}数值不稳定。因此，我们构造了一个正交基{v（v）₁,v（v）₂, ...,v（v）_米}的K_米通过将Arnoldi算法应用于v（v）,A类 v（v）, ...,A类^米-1v（v）.让H（H）_米成为米×米用Arnoldi算法计算的上Hessenberg矩阵小时_米+1,米是最后一个规范化值。由V（V）_米我们表示N个×米带列向量的矩阵v（v）₁,v（v）₂, ...,v（v）_米。那么

(18)

哪里e（电子）_k个是一个适当大小的列向量，其k个-th分量为1，所有其他分量为零。直觉上，等式(18)（b）声明H（H）_米是的矩阵投影A类到上面K_米w.r.t.依据V（V）_米.近似值e（电子）^A类v（v）在里面K_米表示使用V（V）_米是e（电子）^A类v（v）≈V（V）_米年，其中年是大小向量米.

我们选择

（19）

从而产生近似误差[46]

(20)

哪里ρ==========================================================||A类||₂是的光谱范数A类.等式中的近似值(19)仍然涉及矩阵指数的计算H（H）_米，但作为H（H）_米尺寸较小且具有特定结构（上海森堡），这需要较小的计算工作量。对于小矩阵的矩阵指数，可以应用Schur分解和Padé逼近等方法[31].

现在假设时间瞬间t吨是任意的，即我们想要近似e（电子）^助教v（v）对一些人来说t吨> 0. 为了控制近似误差，我们计算e（电子）^助教v（v）逐步利用它对于τ₁,τ ₂≥ 0. 对于步长τ，我们近似e（电子）^τAv（v）由||v（v）||₂ 因为Krylov子空间与A类和τA是相同的，并且根据公式(20)如果||Aτ||₂很小。

总之，Krylov子空间方法近似于e（电子）^在v（v）通过动态选择步长的时间迭代向前推进τ₁,τ₂,.... 在每个迭代步骤中，我们计算一个向量

其中最初是u个₀=v（v）.矩阵和结果来自我-构造子空间正交基的Arnoldi算法的第次执行跨度{u个_我-1,A类 u个_我-1, ...,A类^米-1u个_我-1}。当经过的时间等于t吨，我们得到了e（电子）^在v（v）.

对于Krylov子空间方法的步长，一种流行的启发式方法是选择τ_我+1取决于误差的估计_我上一步的。让托尔>0是预先指定的公差。一个通用方案由三个步骤组成[36]. （1）定义，（2）计算u个_我和误差估计ϵ_我.（3）如果ϵ_我> 1.2托尔拒绝u个_我，更换ϵ_我-1带ϵ_我，然后转至步骤（1）。对于我们的实验结果，我们使用了Expokit软件[48]其中小指数，，通过不可约Padé近似计算[49].

局部Krylov子空间方法

假设我们在算法的第13行中使用了Krylov子空间方法s窗口（见表1，右），近似值（参见公式(7)). 通过出租v（v）=,A类=、和t吨=τ_j个我们可以应用与全局情况相同的过程。注意，这会产生嵌套迭代，因为时间步τ_j个通常比Krylov子空间方法的时间步长大得多。对于Krylov子空间方法，使用矩阵问_j个而不是问提供了重要优势。Arnoldi过程的速度比问_j个通常包含的非零条目少于问同样，滑动窗口方法可能提供具有较小谱范数的矩阵||问_j个||₂这允许在Krylov近似过程中使用更大的时间步长，如我们的实验结果所示。

实验结果

我们在表中对这两种算法进行了编码1在C++中，并在3.16 GHz Intel双核Linux PC上进行了实验。我们讨论了示例1和示例2的实验结果，以及Goutsias的模型[50]和一个双稳态拨动开关[51]. Goutsias模型描述了噬菌体中抑制蛋白的转录调控λ涉及六种不同的物种和十种反应。双稳态拨动开关是基因开关的原型，具有两个相互竞争的阻遏蛋白和四个反应。图中列出了所有结果2.

如下文所述，我们还实现了Burrage等人提出的方法[21]为了在运行时间和精度方面与我们的算法进行比较。此外，对于有限示例，我们将我们的方法与全局分析进行了比较，即在每个步骤中都考虑了整个状态空间。我们没有将我们的方法与Gillespie模拟或基于Fokker-Planck方程的近似方法进行比较。前一种方法仅提供概率分布的估计，如果估计小概率，则不可行[52]. 后一种方法不考虑分子数的离散性，并且已知在这里考虑的小种群情况下提供了错误的近似值[53].

参数

我们修正了输入ϵ=10^-8算法的s窗口所有实验（见表1，右侧）。我们选择了输入δ以动态方式确保j个-第十步我们损失的概率不超过10^-5·τ_j个/(t吨_第页-t吨₀)通过限制在重要的州，也就是说，我们减少δ直到算法第4行之后s窗口成套设备S公司_j个最多包含10个^-5·概率小于前一组S公司_j个-1.在图中2，我们列出了使用的平均值δ.

在下文中，我们给出了用于我们获得的实施例1和实施例2的结果的参数的细节。对于剩下的两个示例，我们列出了相应的化学反应和我们为图中的结果选择的参数2.

酶示例

对于示例1，我们尝试了不同的参数集，称为集合a）-c）（参见图2). 对于参数组合a），我们有c（c）₁=c（c）₂= 1,c（c）_三=0.1，从1000种酶和100种底物开始。在这种情况下，可到达状态的数量为5151。对于参数集b）和c），我们有c（c）₁=c（c）₂=c（c）_三=1，从100个酶和1000个底物以及500个酶和500个底物开始，分别产生96051和125751个可达状态。每次我们根据时间选择时间范围，直到大部分概率质量集中在所有底物分子转化为产物的状态。对于时间步τ_j个在算法中s窗口，我们应用上述条件。

我们考虑等式中迭代的四个分支(11)为了确定状态变量的上下限。（1）为了估计复合分子的最大数量（以及酶群的最小数量），我们实施了更多类型的反应R（右）₁比平均水平高(κ₁=)，类型较少R（右）₂和R（右）_三(κ_三=和κ₂=). （2）通过考虑较少类型的反应R（右）₁(κ₁=)和更多类型R（右）₂和R（右）_三(κ_三=和κ₂=)复合群体变得最小（酶群体最大）。（3）最小类型数的估计P（P）分子（以及类型的最大数量S公司分子）通过执行更多类型的反应获得R（右）₂(κ₂=)，类型较少R（右）₁和R（右）_三(κ₁=和κ_三=). （4）最后，更多类型的反应R（右）₁和R（右）_三(κ₁=和κ_三=)，类型较少R（右）₂(κ₂=)最大限度地增加产物分子的数量（并使底物分子的数量最小化）。

以酶为例，如果初始条件是固定的，那么一种状态是由至少两个条目唯一确定的，比如复合物和产物分子的群体。然而，如果复杂分子的预期数量较高，矩形窗口形状的结果较差。原因是在这种情况下，概率质量位于对角线上（参见图三). 如果有效状态集被矩形窗口捕获，则它可能包含许多不重要的状态。通过考虑窗口构造过程中所有状态变量的边界以及守恒定律，可以避免这个问题。更准确地说，图中的平行四边形三通过计算每个值来构造属于P（P）上下限锿通过和，其中年= (年₁,年₂，0，0）是初始总体向量和人口的上限和下限是E类,S公司,锿、和P（P）.

注意图中的平行四边形三是由系统的守恒定律引起的。一般来说，应该考虑守恒定律，因为否则窗口可能与守恒定律不一致，即它可能包含无法到达的状态。

基因表达示例

在图中2我们给出了示例2的结果。参数集a）和参数集b）（称为集合a）和集合b）的区别在于，对于a）我们从空系统开始，对于b）我们从100 mRNA分子和1000蛋白质开始。对于这两种变量，我们都选择速率常数c（c）₁= 0.5,c（c）₂= 0.0058,c（c）_三= 0.0029,c（c）₄= 0.0001. 我们使用的时间步长由时间间隔部分中的条件决定。请注意，我们无法使用全局方法求解此示例，因为可达状态的数量是无限的。专栏错误包含总错误η_第页（参见公式(8))以及次（秒）指以秒为单位的运行时间。在列中百分比。我们列出了用于窗口构造的总运行时间的百分比。专栏平均风.大小指窗口中的平均状态数。

对于基因表达的例子，我们使用了四个分支：我们通过选择和并将其最小化和.反应R（右）₂和R（右）₄与这个物种无关。我们通过选择最大化蛋白质群体、和并将其最小化、和.

Goutsias模型

该模型在图中称为Goutsias模型2，由以下化学反应组成[50]:

1:
RNA T RNA+M
2:
M T？
三：
DNA。D T RNA+DNA。D类
4:
RNA T？
5:
DNA+D T DNA。D类
6:
DNA。D T DNA+D
7:
DNA。D+D T DNA.2D
8:
DNA.2D T DNA。D+D
9:
M+M T D公司
10:
D T M+M

我们使用了与Goutsias相同的动力学常数[50]和Sidje等人[21]以及相同的初始状态。

下面，我们列出状态变量上界的分支。如果分别考虑相反的组合，则可获得下限。我们参考图4以便于说明简化分支选择的反应之间的依赖性。我们通过选择组合来最大化RNA种群.我们通过选择组合来最大化单体数量。我们通过选择组合来最大化二聚体分子的数量注意，虽然反应5消耗二聚体，但选择最大化系统中二聚体的数量。这是因为反应5是生成单体和二聚体所必需的。使用滑动窗口方法，我们永远不会耗尽内存，但在较长的时间范围内，运行时间可能会非常长。原因是窗口很大，因为系统在稍后的时间包含许多单体和二聚体。对于图中的结果2我们一直在考虑这个系统t吨=300，而Sidje等人[21]，最长时间范围为t吨= 100. 在图中5我们绘制了物种的分布图M（M）和D类.

双稳态拨动开关

拨动开关涉及两种化学物质A类和B类和四种反应。让x个= (x个₁,x个₂)∈ 。反应如下∅→A类,A类→∅,∅→B类,B类→∅及其倾向函数α₁, ...,α ₄由提供α₁(x个)=c（c）₁/(c（c）₂+),α₂(x个)=c（c）_三·x个₁,α_三(x个)=c（c）₄/(c（c）₅+),α₄(x个)=c（c）₆·x个₂注意，在本例中，倾向函数不是等式中描述的形式。1对于我们的实验结果，我们选择了与Sjöberg等人相同的参数[23]也就是说，c（c）₁=c（c）₄= 3·10^三,c（c）₂=c（c）₅= 1.1·10⁴,c（c）_三=c（c）₆=0.001，以及β=γ= 2. 初始分布为高斯分布(μ,σ²)带有μ=（133133）^T型和我们考虑了明显的四个分支，每个分支都旨在最小化/最大化这两个组件中的一个。分支最小化A类例如将具有较少的第一反应和较多的第二反应。

讨论

在这一节中，我们讨论了我们的算法的精度和运行时间，其中我们考虑了不同的求解方法和不同的时间步长机制。此外，我们将我们的方法与全局分析进行了比较。

准确性

列标记为错误在图中2显示总错误η_第页（参见公式(8))滑动窗方法加上均匀化误差（以ϵ=10为界^-8). 使用Krylov子空间方法的误差产生了相同的精度，因为对于均匀化和Krylov子空间方法，误差界是先验指定的。对于所有示例，总误差不超过1×10^-4这意味着在整个过程中损失的概率质量不超过0.01%。当然，可以在Algorithm的while循环中添加精度检查s窗口，根据需要展开当前窗口，然后重新计算。但由于该方法始终返回一个小错误，因此忽略了这一点。

我们还考虑了相对误差，即，对于州x个 ∈ W公司_j个具有> 10^-5.我们近似值通过求解方程式(13)通过全局均匀化，其中我们使用截断误差ϵ=10^-8由于这只有在状态空间有限的情况下才可能实现，因此我们只比较了酶的相对误差。我们的计算表明，相对误差始终小于10^-4.

为了支持我们在窗口构建部分的考虑，我们进行了实验，在实验中我们只选择了Algorithm第17行中的平均值ContDetApprox公司（见表1，左）。更准确地说，对于窗口的构造，我们不考虑反应数的偏差，而只考虑平均数。在这种情况下，我们调用了该方法ContDetApprox公司带输入2τ以确保概率质量平均移动到窗口中心，而不是太靠近边界。对于这种配置，总误差高出几个数量级，例如，对于酶示例的参数集a），总误差为0.0224。

最后，我们测试了算法第7-10行中构造的窗口的大小s窗口.我们更改了算法s窗口通过在第10行和第11行之间将窗口大小减少5%。在这种情况下，总误差η_第页增加。例如，η_第页=0.35%，对于酶示例的参数集a）。这些结果证实了滑动窗口的大小和位置使得近似误差较小，而显著较小的窗口导致显著较高的近似误差。

运行时间

对于时间复杂性分析，我们主要关注三个问题。

滑动窗口方法与全局分析：我们将滑动窗口方法在一个步骤中与全局解进行比较，并将其与另一个窗口方法进行比较，其中窗口的大小在必要时增加一倍。
求解方法（均匀化与Krylov子空间方法）：In Algorithms窗口，我们通过与Krylov子空间方法交换均匀化来改变求解方法。
时间间隔（等距与自适应时间步长）：我们使用不同的方法来确定长度τ_j个算法第3行中的下一时间步s窗口.

滑动窗口法与全局分析

我们使用酶的例子来比较滑动窗口解和全局解（全局均匀化和全局Krylov子空间方法），因为它具有有限的状态空间。注意，所有其他示例都无法使用全局方法求解，因为它们的状态空间是无限的。我们列出了计算（参见公式(三))使用图中的全局方法6.

观察到全局均匀化方法的总误差较小（与标有错误)因为唯一的误差源是等式中无穷和的截断(13). 在带有标题的列中#状态我们列出了可到达的状态数。在全局求解过程中，我们始终考虑所有可达状态，而在滑动窗口方法中，在一个时间步长内考虑的平均状态数要小得多。这就是滑动窗口方法速度快得多的主要原因。此外，在均匀化的情况下，全局均匀化的速率是所有退出速率中的最大值，而对于局部均匀化，我们取当前窗口中所有状态的最大值。注意，与局部最大值相比，全局最大值可能很大。这解释了全局均匀化方法的糟糕性能。当Krylov子空间方法用于全局解时，全局解的运行时间也高于局部Krylof子空间方法（滑动窗口方法与Krylov-子空间方法相结合）的运行时间。同样，原因是在滑动窗口迭代期间考虑的状态数量较少。此外，矩阵问_j个具有便于使用更大因而更少时间步长的数值属性。用于求解等式的迭代步骤总数(6)与全局Krylov子空间方法相比，滑动窗口方法确实很小（平均步骤少20倍左右）。

现在我们将重点放在滑动窗口方法和另一个局部方法（称为双窗口法对于后者，我们以与Sidje等人类似的方式计算概率向量[21]. 我们从一个初始窗口开始，并应用Krylov算法。我们不迭代时间间隔[t吨_j个-1,t吨_j个)但是使用Krylov子空间方法的步长。在每个时间步之后，我们删除窗口中不用于其余计算的部分。如果错误超过某个阈值，我们将扩展窗口的大小。由于该方法的性能在很大程度上取决于初始窗口和窗口展开的方向，因此我们首先使用与滑动窗口方法相同的窗口，并始终沿对计算最有利的方向展开。为此，我们使用了从滑动窗口方法的实验中获得的关于概率质量移动方向的信息。窗口的扩展是通过将其所有边的长度加倍来实现的。

我们将双窗口方法应用于酶的例子和基因表达。对于我们尝试的所有参数集，滑动窗口方法在运行时间方面优于双窗口方法（平均加速因子为5）。在滑动窗口方法的情况下，Krylov子空间近似的总迭代次数比双窗口方法少13倍（平均值为6.5）。请注意，对于任意系统，如果没有关于系统的额外知识，就无法应用加倍窗口方法，即通常不清楚窗口必须向哪个方向扩展。

我们的结果表明，与全局分析相比，滑动窗口方法实现了显著的加速，也与双窗口方法相比。此外，虽然全局分析仅限于有限状态系统，并且双窗口方法需要有关系统的额外知识，但我们的方法可以应用于概率质量的重要部分位于可控制状态子集的任何系统。如果系统的维数很高，那么概率质量的很大一部分可能位于难以处理的许多状态，在这种情况下，我们算法的内存需求可能会超过可用容量。

解决方法

在滑动窗口迭代过程中，可以在算法的第13行中应用不同的求解方法s窗口我们主要讨论均匀化方法和Krylov子空间方法。图中的运行时间2（比较由标记的列sWindow+均匀化列标记为sWindow+克里洛夫)表明Krylov子空间方法的性能更好（平均加速因子约为1.5）。原因是Krylov子空间方法比均匀化方法对刚度更具鲁棒性。对于非刚性系统，均匀化方法的性能优于Krylov子空间方法[19,39]. 然而，由于生化网络模型通常是僵化的，Krylov子空间方法似乎特别适合于这一领域。

时间间隔

为了确认我们在时间间隔一节中的考虑，我们还使用了等距时间步长的滑动窗口方法。对于所有示例，与使用自适应时间步长（平均加速因子为3.5）相比，使用等距时间步长会导致更长的计算时间。时间步长的自适应选择还有一个优点，即我们可以控制窗口的大小，避免算法的内存需求超过可用容量。

结论

滑动窗口法是解决化学主方程数值算法性能问题的一种新方法。它用一系列局部分析取代了系统的全局分析。该方法适用于各种化学反应系统，包括事先不知道化学物种种群大小上限的系统。该方法与所有现有的求解CME的数值算法兼容，也与其他技术相结合，例如时间尺度分离[26,27]，是可能的。

我们通过一些实验证明了我们的方法的有效性。结果是有希望的，因为即使系统具有超过200万个状态且具有显著概率，也可以在可接受的时间内求解。此外，对于比这里介绍的更复杂的示例，通常只考虑状态空间中相对较小的一部分就足够了。细胞中的分子数量总是有限的，通常生化系统只遵循少数不同的趋势。换言之，在生物化学系统中，很少有大量不同的场景具有显著的可能性。因此，我们期望滑动窗口方法能够成功地应用于具有许多化学物种和反应的系统，只要概率质量的重要部分始终位于可控制的状态子集。此外，还可以进行进一步的增强，例如拆分窗口，这对于多平台系统特别有用。此外，我们计划将我们的算法自动化，除了初始条件和反应集之外，不需要用户进一步输入，例如最大化/最小化某些群体的反应组合。

工具书类

Elowitz MB，Levine MJ，Siggia ED，Swain PS：单细胞中的随机基因表达。科学。2002, 297: 1183-1186. 10.1126/科学.1070919
第条中国科学院公共医学谷歌学者
Ozbudak EM、Thattai M、Kurtser I、Grossman AD、van Oudenaarden A：单个基因表达中的噪声调节。自然遗传学。2002年，31:69-73。10.1038/ng869
第条中国科学院公共医学谷歌学者
Blake WJ、Kaern M、Cantor CR、Collins JJ：真核基因表达中的噪音。自然。2003, 422: 633-637. 10.1038/性质01546
第条中国科学院公共医学谷歌学者
Fedoroff N，Fontana W：大分子的小数目。科学。2002, 297: 1129-1131. 10.1126/科学1075988
第条中国科学院公共医学谷歌学者
Kierzek A，Zaim J，Zielenkiewicz P：转录和翻译起始频率对原核基因表达随机波动的影响。生物化学杂志。2001, 276 (11): 8165-8172. 10.1074/jbc。M006264200号
第条中国科学院公共医学谷歌学者
保尔森J：总结基因网络中的噪音。自然。2004, 427 (6973): 415-418. 10.1038/性质02257
第条中国科学院公共医学谷歌学者
Swain PS，Elowitz MB，Siggia ED：基因表达随机性的内在和外在贡献。美国国家科学院院刊，2002，99（20）：12795-12800。10.1073/pnas.162041399。
第条中国科学院谷歌学者
Turner TE，Schnell S，Burrage K：体内反应建模的随机方法。复合生物化学。2004, 28: 165-178. 10.1016/j.compbiochem.2004.05.001。
第条中国科学院谷歌学者
威尔金森DJ：系统生物学随机建模。2006年，查普曼和霍尔，
谷歌学者
McAdams HH，Arkin A：这是一个嘈杂的行业！。遗传学趋势。1999, 15 (2): 65-69. 10.1016/S0168-9525（98）01659-X
第条中国科学院公共医学谷歌学者
Rao C、Wolf D、Arkin A：细胞内噪声的控制、利用和耐受。自然。2002, 420 (6912): 231-237. 10.1038/自然01258
第条中国科学院公共医学谷歌学者
Thattai M，van Oudenaarden A：基因调控网络中的固有噪声。美国国家科学院院刊，2001，98（15）：8614-8619。10.1073/pnas.151588598。
第条中国科学院谷歌学者
McAdams HH，Arkin A：基因表达的随机机制。美国国家科学院院刊，1997年，94:814-819。10.1073/pnas.94.3.814。
第条中国科学院谷歌学者
Arkin A，Ross J，McAdams HH：噬菌体发育途径分叉的随机动力学分析λ-感染的大肠杆菌细胞。遗传学。1998年，149年：1633-1648年。
公共医学中心中国科学院公共医学谷歌学者
Srivastava R，You L，Summers J，Yin J：细胞内病毒动力学的随机与确定性建模。《理论生物学杂志》。2002, 218: 309-321. 2006年10月10日/jtbi.2002.3078
第条中国科学院公共医学谷歌学者
Gillespie DT:马尔可夫过程。1992年，学术出版社，
谷歌学者
Gillespie DT:耦合化学反应的精确随机模拟。物理化学杂志。1977, 81 (25): 2340-2361. 10.1021/j100540a008。
第条中国科学院谷歌学者
Gillespie DT:化学反应系统的近似加速随机模拟。化学物理杂志。2001, 115 (4): 1716-1732. 10.1063/1.1378322.
第条中国科学院谷歌学者
Stewart WJ：马尔可夫链数值解导论。1995年，普林斯顿大学出版社，
谷歌学者
Munsky B，Khammash M：求解化学主方程的有限状态投影算法。化学物理杂志。2006, 124: 044144-10.1063/1.2145882.
第条谷歌学者
Burrage K，Hegland M，Macnamara F，Sidje B：一种基于Krylov的有限状态投影算法，用于求解生物系统离散建模中产生的化学主方程。马尔科夫150周年纪念大会的会议记录。编辑：Langville AN，Stewart WJ。2006, 21-38. 博森图书公司，
谷歌学者
Sjöberg P：基因和蛋白质随机建模的数值方法。博士论文。2007年，瑞典乌普萨拉大学，
谷歌学者
Sjöberg P，Lötstedt P，Elf J：分子生物学中主方程的福克-普朗克近似。科学计算与可视化。2009, 12: 37-50. 10.1007/s00791-006-0045-6。
第条谷歌学者
Hegland M，Burden C，Santoso L，Macnamara S，Booth H：应用于基因调控网络的随机主方程求解器。J计算应用数学。2007, 205: 708-724. 2016年10月10日/j.cam.2006.02.053。
第条谷歌学者
Engblom S：应用于化学主方程的Galerkin光谱法。通信计算物理。2009, 5: 871-896.
谷歌学者
Busch H，Sandmann W，Wolf V：酶催化底物转化的数值聚合算法。CMSB程序。2006, 4210: 298-311. LNCS、Springer、，
谷歌学者
Peles S，Munsky B，Khammash M：使用时间尺度分离和有限状态投影简化和求解化学主方程。化学物理杂志。2006, 125: 204104- 10.1063/1.2397685
第条公共医学谷歌学者
Cao Y，Gillespie D，Petzold L：套叠模拟方法的有效步长选择。化学物理杂志。2006, 124 (4): 044109-11. 10.1063/1.2159468
第条公共医学谷歌学者
坎彭NGv：物理和化学中的随机过程。2007年，爱思唯尔，3岁，
谷歌学者
《随机过程导论》。1975年，普伦蒂斯·霍尔，
谷歌学者
Moler CB，Van Loan CF：计算矩阵指数的十九种可疑方法。SIAM评论。1978, 20 (4): 801-836. 10.1137/1020098.
第条谷歌学者
Grassmann WK，：计算概率。2000年，Kluwer学术出版社，
谷歌学者
Sidje R，Stewart W：马尔可夫链中产生的大型稀疏矩阵指数的计算方法综述。马尔可夫链，计算统计和数据分析29。1996, 345-368.
谷歌学者
Jensen A:Markoff链，用于研究Markoff过程。斯堪的纳维亚半岛。1953, 36: 87-91.
谷歌学者
Gross D，Miller D：作为瞬态马尔可夫过程建模工具和求解程序的随机化技术。运营研究。1984, 32 (2): 926-944. 10.1287/opre.32.2343。
第条谷歌学者
Philippe B，Sidje R：基于Krylov子空间的马尔可夫过程的瞬态解。马尔可夫链数值解第二届国际研讨会会议记录。1995, 95-119. Kluwer学术出版社，
谷歌学者
Hairer E，Norsett S，Wanner G：求解常微分方程I：非刚性问题。2008年，施普林格，
谷歌学者
Hairer E，Wanner G：求解常微分方程II。2004，刚性和微分代数问题Springer，
谷歌学者
Reibman A，Trivedi K：马尔可夫模型的数值瞬态分析。《计算运营研究》，1988年，15:19-36。10.1016/0305-0548(88)90026-3.
第条谷歌学者
Zhang J，Watson LT，Cao Y:化学主方程解的改进均匀化方法。技术代表TR-07-31，《计算机科学》，弗吉尼亚理工大学，2007年，
谷歌学者
Hellander A：基于均匀化和拟蒙特卡罗的化学主方程瞬态解的有效计算。化学物理杂志。2008, 128 (15): 154109- 10.1063/1.2897976
第条公共医学谷歌学者
Sidje R，Burrage K，MacNamara S：计算马尔可夫链瞬态分布的非精确均匀化方法。SIAM科学计算杂志。2007, 29 (6): 2562-2580. 10.1137/060662629.
第条谷歌学者
de Souza e Silva e，Gail R：马尔可夫链的瞬态解。计算概率。编辑：格拉斯曼WK。2000, 43-79. Kluwer学术出版社，
第章谷歌学者
Fox BL，Glynn PW：计算泊松概率。ACM通信。1988, 31 (4): 440-445. 10.1145/42404.42409。
第条谷歌学者
Dunkel J，Stahl H：关于刚性马尔可夫链的瞬态分析。第三届IFIP关键应用可靠计算工作会议纪要。1993, 137-160.
第章谷歌学者
Gallopoulos E，Saad Y：关于抛物方程的并行解。程序。ACM SIGARCH-89。1989年，17-28。ACM压机，
谷歌学者
Saad Y：分析矩阵指数算子的一些Krylov子空间近似。SIAM J数字分析。1992, 29: 209-228. 10.1137/0729014.
第条谷歌学者
Sidje RB:EXPOKIT:计算矩阵指数的软件包。ACM数学软件汇刊。1998, 24: 130-156. 10.1145/285861.285868.
第条谷歌学者
贝克G：Padé近似法的要点。1975年，纽约学术出版社，
谷歌学者
Goutsias J：随机生化系统中快速反应动力学的准平衡近似。化学物理杂志。2005, 122 (18): 184102- 10.1063/1.1889434
第条公共医学谷歌学者
Gardner T，Cantor C，Collins J：大肠杆菌中基因切换开关的构建。自然。2000, 403: 339-342. 10.1038/35002131
第条中国科学院公共医学谷歌学者
Didier F，Henzinger TA，Mateescu M，Wolf V：噪声细胞过程中事件概率的近似。程序。CMSB的。2009年，5688:173-LNBI，
谷歌学者
Ferm L，Lötstedt P，Hellander A：按尺寸参数缩放的主方程近似层次。科学计算杂志。2008, 34: 127-151. 2007年10月10日/10915-007-9179-z。
第条谷歌学者
Henzinger T，Mateescu M，Wolf V：无限马尔可夫链的滑动窗口抽象。程序CAV。2009, 5643: 337-352. LNCS、Springer、，
谷歌学者

下载参考资料

致谢

这项研究的部分资金由瑞士国家科学基金会（205321-111840）和萨尔州大学多模计算与交互卓越集群（Cluster of Excellence on Multimodal Computing and Interaction at Saarland University）提供。这篇论文的初步版本出现在《国际计算机辅助验证会议记录》上[54].

作者信息

作者和附属机构

德国萨尔布吕肯萨尔州大学计算机科学系
维雷娜·沃尔夫
印度孟买国际技术学院计算机科学与工程系
拉西尔·戈尔
瑞士洛桑EPFL计算机与通信科学学院
玛丽亚·马特埃斯库
奥地利克洛斯特内堡科学技术研究所
托马斯·汉津格

作者

维雷娜·沃尔夫
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
拉西尔·戈尔
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
玛丽亚·马特埃斯库
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
托马斯·汉津格
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者

通讯作者

与的通信维雷娜·沃尔夫.

其他信息

作者的贡献

大众汽车和TAH设计了这项研究。VW、RG、MM和TAH开发了该算法，由RG和MM执行。VW、MM和TA编写了手稿，所有作者都阅读并批准了该手稿。

作者提交的原始图像文件

下面是作者提交的原始图像文件的链接。

图1的作者原始文件

图2的作者原始文件

图3的作者原始文件

图4的作者原始文件

图5的作者原始文件

图6的作者原始文件

权利和权限

本文由BioMed Central Ltd.授权发布。这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/2.0)，允许在任何媒体上不受限制地使用、分发和复制，前提是正确引用了原作。

转载和许可

关于本文

引用这篇文章

沃尔夫，V.，戈尔，R.，马泰斯库，M。等。使用滑动窗口求解化学主方程。BMC系统生物 4, 42 (2010). https://doi.org/10.1186/1752-0509-442

下载引文

收到:2009年11月1日
认可的:2010年4月8日
已发布:2010年4月8日
内政部:https://doi.org/10.1186/1752-0509-442

用滑动窗口求解化学主方程

摘要

背景

结果

结论

背景

随机模型

化学主方程

结果

滑动窗法

窗户构造

滑动窗口算法

时间间隔

数值求解方法

均匀化

全局均匀化

时间复杂性和刚度

局部均匀化

Krylov子空间

全局Krylov子空间方法

局部Krylov子空间方法

实验结果

参数

酶示例

基因表达示例

Goutsias模型

双稳态拨动开关

讨论

准确性

运行时间

滑动窗口法与全局分析

解决方法

时间间隔

结论

工具书类

致谢

作者信息

作者和附属机构

通讯作者

其他信息

作者的贡献

作者提交的原始图像文件

图1的作者原始文件

图2的作者原始文件

图3的作者原始文件

图4的作者原始文件

图5的作者原始文件

图6的作者原始文件

权利和权限

关于本文

引用这篇文章

分享这篇文章

关键词

BMC系统生物学

联系我们