摘要
动机:鲁棒性是指系统在面对扰动时保持功能的能力。它对于自然和工程生物系统的正确运行至关重要。稳健性通常定义为特别的这就阻碍了北野最近倡导的生物稳健性理论的丰硕发展。
结果:在本文中,我们提出了鲁棒性的一般定义,适用于时态逻辑LTL(线性时态逻辑)中可表达的任何生物函数,以及广泛的模型类和扰动类型。此外,我们在BIOCHAM 2.8中提出了一种计算方法和实现,用于自动估计给定行为相对于给定扰动集的鲁棒性。我们的方法的适用性和生物相关性通过测试和改进合成转录级联的定时行为的稳健性得到了证明,该级联可用作合成生物学应用的生物计时器。
可利用性:BIOCHAM 2.8版和转录级联模型可在http://containtes.inia.fr/BIOCHAM公司/
联系人: gregory.batt@inria.fr
1简介
鲁棒性可以定义为系统在面对扰动时保持功能的能力。多年来,许多研究从理论和实验上证明了鲁棒性是许多生物过程的关键特性,并提出了促进鲁棒性的机制(例如Barkai和Leibler,1997; 电池等。,2007; Chaves公司等。,2007; 奇利贝蒂等。,2007; 戴维森和莱文,2008; El-Samad公司等。,2005; Gonze(消失)等。,2002; 英格里亚,2004; 沈等。,2008; 希纳尔等。,2007; 斯特林等。,2004年b; 冯·达索等。,2000). 健壮性现在被视为生物系统的基本特征之一,因为它允许生物系统在存在分子噪声和环境波动的情况下正常运行。优秀的评论调查了生物稳健性的作用,并讨论了它与生物系统的进化性、生物网络的模块性以及稳健性和脆弱性之间的权衡的有趣关系(例如Kitano,2004; 斯特林等。,2004年a; 易等。,2000). 特别是,在合成生物学的背景下,这些是设计层面需要考虑的关键问题。
直观地看,健壮性的概念似乎很容易定义。我们考虑(i)一个特定的系统,(ii)一个特殊的函数和(iii)一组特殊的扰动,并评估扰动如何影响(或不影响)给定的函数。然而,除了北野这个明显的例外(2007),还没有提出鲁棒性的一般形式化定义。稳健性的精确定义通常具有高度的问题特异性。这使得很难讨论和比较在不同上下文中发现的健壮性,甚至在类似上下文中,但使用不同形式的健壮定义进行计算。在北野(2007)提出了生物鲁棒性理论的数学基础,旨在为鲁棒性提供一个统一的视角。
虽然从理论角度来看非常有趣,但北野的定义在应用于特定问题时可能过于笼统。实际上,该定义依赖于所谓的评估函数,该函数使用未指定的、依赖于问题的实值性能函数进行定义。这里,我们建议使用新引入的时序逻辑公式违例度的概念来定义评估函数(Fages和Rizk,2008). 直观地说,违例程度反映了扰动系统的特定行为(以数字时间轨迹形式给出)与预期参考行为(以时间逻辑公式表示)之间的距离。由于(i)时态逻辑是表示语言,用于形式化动力学系统的时态行为,以及(ii)违例程度可以自动计算,所以我们对Kitano定义的实例化既有一般的和计算的我们工作的主要贡献是,我们提出了一种计算方法,并实现了鲁棒性的自动估计,该估计适用于广泛的动力学特性和各种可能的扰动。我们只是要求描述预期行为的属性可以用时序逻辑表示,系统的行为可以用数值轨迹表示(可能通过确定性或随机模型的数值模拟获得)。
这项工作的第二个贡献是,我们提出了两个紧密相关但不同的稳健性概念,这些概念在出版物中被滥用,即绝对稳健性表示系统在扰动下的平均功能,以及相对稳健性对于给定的系统标称行为,量化扰动对标称行为的影响。我们相信,区分这两个概念将有助于阐明对生物系统鲁棒性的分析。毫无疑问,正式的定义有助于作出这种区分。
我们的方法的适用性和生物学相关性通过对内置的合成转录级联的时间响应的稳健性的分析来说明大肠杆菌该系统表现出高的细胞间变异性,从而防止将其用作生物计时器。我们寻找能够提高“适时”行为稳健性的参数修改。
本文的其余部分组织如下。在下一节中,我们将简要描述Fages和Rizk中引入的违例度概念(2008). 在第3节,我们提出了鲁棒性估计的建议方法及其在BIOCHAM 2.8中的实现。在第4节,我们详细介绍了我们的方法在合成转录级联稳健性分析中的应用。
2临时逻辑属性的违反程度
我们首先定义了线性时序逻辑(LTL)在时间数字轨迹上的布尔语义(第2.1节). 然后,我们展示了如何使用第2.2节,我们可以定义时序逻辑公式的连续满意度(第2.3节)更好地适应稳健性的定量概念。
2.1数字道的时序逻辑语义
在本文中,我们认为生物系统的行为是由数值时间轨迹描述的。这些轨迹可以通过实际系统上的实验或随机或确定性模型的数值模拟获得。正式地说,a数值轨迹是描述系统随时间演变的元组的有限序列:T型=(秒0,秒1,…,秒n个),使用是严格增加的时间点序列,以及是状态变量值及其导数的向量t吨我.英寸图1a、 描述了蛋白质浓度的假设演变。关联的跟踪是T型=((0, 6, 1.3), (2, 8, 0.8),…, (24, 5, 0)).
图1。
(一)描述蛋白质浓度时间演变的数值轨迹。(b条)满意度域𝒟T型,ϕ(年)QFLTL公式的(年)=F类([A]>年1∧F类[答]<年2)和跟踪T型和LTL公式1, ϕ2和三,用公式空间表示。(c(c)和d日)三种扰动的满意域表示第页1,第页2、和第页三. 𝒟第页我表示𝒟T型第页我, ϕ(年)在(c)中,满意度域的交集(阴影部分)不为空Rsd(卢比)秒ϕ,P(P)=3.属性对于所有扰动都是满足的。在(d)中,满足域的交集为空Rsd(卢比)秒ϕ,P(P)=∞.
我们使用LTL来表示生物系统的动力学特性。时间逻辑已被开发用于指定(通常是离散的)动态系统的行为(艾默生,1990). 典型的属性包括可达性(系统可以达到给定的状态)、必然性(系统必然会达到给定状态)、不变性(属性总是真的)、响应性(事件必然触发特定的行为)和事件的无限次出现(如振荡)。在Antoniotti中可以找到系统生物学中时间逻辑表达的示例等。(2003); 电池等。(2005); 贝尔诺等。2004); Calzone公司等。(2006)查布里埃尔和法赫斯(2003). LTL公式是使用原子命题和LTL运算符构建的。
在我们的方法中,原子命题π表示对时间、蛋白质浓度及其衍生物的实际线性约束。原子命题的无限集用∏表示。
LTL运算符包括常用的逻辑运算符,例如否定(\),逻辑和(∧),逻辑或(ν) 和含义(→)和特定的时态操作符,例如下一个(X(X)),未来(F类),全球(G公司)和直到(U型).X(X)ϕ,F类ϕ,G公司和U型ψ、 分别是指在下一个时间、未来某个时间持有一个财产,在未来所有时间持有或持续持有,直到另一个财产ψ持有。这些操作符可以组合起来表示复杂的动力学特性。例如,跟踪T型在中表示图1a满足公式1=F类([答]>7 ∧F类[答]<3),表示在某个时间点,蛋白A浓度超过7,然后低于3。由于否定可以被推到具有算子通常的对偶性质的原子命题,并且原子命题集是通过否定来封闭的,因此我们在不损失一般性的情况下只考虑无否定的LTL公式。
LTL公式的标准语义通常定义为无限执行,即无限跟踪。因为在我们的例子中,跟踪是有限的,所以必须调整LTL的通常语义。让T型=(秒0,秒1,…,秒n个)是有限数值迹,π∈∏是一个原子命题,ψ,ψ是LTL公式。然后,LTL公式关于有限迹的语义归纳定义为T型⊧iff秒0⊧,和我们的LTL语义与在最后状态上的自循环完成的有限轨迹上使用的标准语义一致(Fages和Rizk,2008). 这种语义不同于Eisner的中性语义等。(2003)对于下一个算子的有限迹,在它们的定义中,最后一个状态总是错误的,而在我们的例子中,它具有对偶性X(X)ϕ=X(X)和任何一种X(X)或X(X)黇保持不变。在实际中,下一个算子主要用于检测局部极值,这种解释差异并不显著。
秒 我⊧πiff用通常的语义满足π,
秒 我⊧∧ψiff秒我⊧和秒我⊧ ψ,
秒 我⊧νψiff秒我⊧或秒我⊧ ψ,
秒 我⊧X(X)敌我识别我<n个和秒我+1⊧,或我=n个和秒n个⊧ ϕ,
秒 我⊧F类iff∃j个∈[我,n个]这样的话秒j个⊧ ϕ,
秒 我⊧G公司iff∀j个∈[我,n个],秒j个⊧ ϕ,
秒 我⊧ ϕU型ψiff∃j个∈[我,n个]秒。秒j个⊧ψ和∀k个∈[我,j个−1],秒k个⊧ ϕ.
值得注意的是,当数值轨迹对应于连续过程的离散表示时,我们使用的离散时间语义可能会导致特定事件被“错过”,而与数值积分方法可能产生的数值误差无关。例如,公式F类([答]≥10)在记录道上解释T型属于图1并最终表示[答]根据积分步长和精度,如果超过10,则可能会发现true或false。因此,在检查有限离散时间轨迹的时间属性时必须小心[有关讨论,请参阅Eisner等。(2003); 费内科斯和帕帕斯(2007)和马勒等。(2008)以及其中的参考文献]。
2.2从模型检查到约束求解
时态逻辑的布尔解释不适合定义稳健性的定量概念。事实上,这两个公式都不是2=F类([答]>12 ∧F类[答]<3)和三=F类([答]>14 ∧F类[答]<3)等待跟踪T型属于图1a.然而,直观地看2比更令人满意三,因为它只需要[答]达到12而不是14。
为了提供LTL公式连续满意度的形式化定义,我们首先考虑具有自由(非国家)实值变量的无量词LTL(QFLTL)公式年(法赫斯和里兹克,2008). 然后,将原始模型检查问题转换为以下内容约束求解问题:对于哪个值年does(年)坚持住T型? 因此,我们为任何跟踪定义T型这个满意度域的(年)作为一组值年其中(年)持有:在续集中,(年)将表示通过从(QF)LTL公式中提取变量获得的QFLTL公式。 有趣的是,LTL公式可以被视为QFLTL公式的一个实例,该公式是通过新变量提取公式中出现的常数而获得的年∈ℝq个例如,to1=F类([答]>7 ∧F类[答]<3),我们将公式⌀联系起来(年)=ϕ(年1,年2)=F类([答]>年1∧F类[答]<年2). 那么我们就有了1=ϕ(7, 3). 此外,对于我们的示例跟踪,可以很容易地进行检查T型,𝒟T型,ϕ(年1,年2)={年1≤10 ∧年2≥2}、10和2分别是[答]在里面T型.
更一般地说,这个变量抽象/实例化过程允许我们将LTL公式视为QFLTL中的一个点公式空间ℝq个,其中q个是出现在中的常数数量(或被变量替换的常数数量,如果不是所有常数都被抽象掉的话)。在图1b、 ¼1, ϕ2, ϕ三和𝒟T型,ϕ在这个公式空间中表示。
提供任何跟踪T型=(秒0,秒1,…,秒n个)和式(年)我们在(Fages和Rizk,2008)满足域𝒟T型,ϕ(年)可以通过在T型和的亚式(年)使用命题1的等式。
P(P)提议1
[满意度域的计算(Fages和Rizk,2008)]
𝒟T型,ϕ(年)=𝒟秒0,ϕ(年),
𝒟秒我,π(年)={年∈ℝq个∣π(年)保持通常的语义},
𝒟秒我,ϕ(年)∧ψ(年)=𝒟秒我,ϕ(年)∩𝒟秒我,ψ(年),
𝒟秒我,ϕ(年)νψ(年)=𝒟秒我,ϕ(年)∪𝒟秒我,ψ(年),
𝒟秒我,F类ϕ(年)=∪j个∈[我,n个]𝒟秒j个,ϕ(年),
𝒟秒我,G公司ϕ(年)=?=j个∈[我,n个]𝒟秒j个,ϕ(年),
𝒟秒我,ϕ(年)U型ψ(年)=∪j个∈[我,n个](𝒟秒j个,ψ(年)∩∩k个∈[我,j个−1]𝒟秒k个,ϕ(年)).
原子命题(单位:)(年)是自由变量的线性约束年,满足域是可以用标准多面体库计算的多面体的有限并和交集。虽然这些操作通常是有效的,但在最坏的情况下,需要在公式空间维度中使用时间指数。然而,它们与状态变量的数量无关。
2.3违规程度
为了量化系统行为的满意度,我们引入了违规程度vd(T型式中关于迹线的T型作为距离在实际规范和有效域之间T型,ϕ(年)QFLTL公式的(年)通过变量抽象获得:因此,违规程度有一个简单的解释,因为量化给定的LTL公式必须更改多少才能保留在给定的数值记录道上. 再次考虑我们的例子图1使用欧几里德距离,我们得到了虚拟磁盘(T型, ϕ1)=0,表示公式满足T型、和虚拟数据(T型, ϕ2)=2和虚拟数据(T型, ϕ三)=4,反映了这一点T型远未达到三比2.
我们想强调的是,在时序逻辑公式中通过变量抽象常量是定义米制的关于公式集。所有集合运算和距离计算都在相应的度量空间中进行,称为公式空间。直接定义轨迹之间的距离似乎更直观。例如,费内科斯和帕帕斯(2006)与类似aim一起使用-定义轨迹上时序逻辑公式的连续解释-给定轨迹之间的距离T型以及满足公式⌀的轨迹集。我们的方法的一个主要优点是,公式空间的维数(抽象常数的数量)通常比跟踪空间的维数低得多(跟踪长度)。在低维空间中执行集合运算和距离计算可能会严重影响这些方法的实际适用性。唐纳森和吉尔伯特(2008)最近也基于时间逻辑公式的满足域的定义,提出了类似的违反程度的概念。然而,(有限)满足域的计算是通过对公式空间采样而不是通过约束求解来完成的。在本文中,我们将使用欧几里德距离。然而,可以使用许多其他距离(例如曼哈顿或切比雪夫),这取决于对距离的期望解释,以及我们将在下一段中看到的对稳健性的期望解释。
为了定义行为的稳健性,更容易用一个积极的概念进行推理,这个概念描述了(可能受扰动的)系统的性能如何,即满足一个动态特性。为此,我们引入了连续的概念满意度关于轨迹的公式T型:哪里虚拟数据是之前介绍的违规程度。将满意度归一化,使其范围在0到1之间,当属性为真时,满意度等于1,当系统远未满足预期属性时,满意度趋于0。对于某些应用程序,使用给定的常量,满意度可能会以不同的方式进行规范化K(K)而不是方程式中的那些(2). 3鲁棒性定义和计算
3.1绝对稳健性
在本文中,我们主要使用北野对稳健性的一般定义。在北野(2007),属性的健壮性一系统的秒关于一组扰动P(P)定义为平均的评估函数的D类一秒系统的所有扰动第页∈P(P),由扰动概率加权问题(第页): 应该强调的是,这个定义非常一般的并且可以在许多情况下使用。不幸的是,北野没有提供多少关于如何定义所谓的评价函数D一秒系统的。该函数应确定系统在扰动下是否仍保持其功能,以及维持到何种程度。需要为特别的并重新实现了鲁棒性的计算。本文的一个主要贡献是证明,使用前面介绍的满意度概念,可以提供一个通用计算框架基于时间逻辑和北野的定义,可用于评估广泛类型的动力学特性和扰动的鲁棒性。
其中是时序逻辑中功能的规范T型第页是表示系统在扰动下的行为的轨迹第页.这一概念稳健性对应于平均功能,即描述系统在扰动下的平均行为。为了说明这一点,请考虑图2描述性能的D类一秒-或者在我们的例子中,两个假设系统在面对扰动时的满意度第页由于这两个图具有相同的平均值,因此这两个系统在均匀分布扰动下的鲁棒性相等。例如,在生物工程背景下,如果“属性”反映了细胞输出的某些产品的数量,那么这两个系统实际上将平均产生相同数量的所需产品。
这种稳健性的概念在Ingolia中得到了应用(2004),马等。(2006)和冯·达索等。(2000)研究大参数变化对果蝇属段极性图案形成。妈妈等。(2006)使用了需要“模式惩罚函数”的布尔标准笔(x个(t吨))低于给定阈值θ*在600和800分钟时=0.0125。QFLTL公式ξ(θ)=G公司(时间∈[600, 800]→笔(x个(t吨))≤θ)表示惩罚函数在整个时间间隔内必须低于θ,并且系统行为的满意度T型第页和(θ*)提供了之间距离的定量度量T型第页以及参考行为。
图2。
假设扰动均匀分布,具有相同绝对鲁棒性(1和2)或相同相对鲁棒性(2和3)的系统。系统1和系统2的性能函数具有相同的平均值,而系统3的性能函数是系统1的一半。
3.2相对稳健性
比较图1和图2时图2名义行为的扰动的后果似乎不同T型0名义行为。在系统1中,扰动会比系统2中更严重地降低系统性能。因此,从健壮性的不同含义来看,可以说系统2比系统1更健壮。这两种稳健性解释(作为平均行为或扰动对标称行为的影响)在文献中被不加区分地使用(参见例如Davidson等。,2003; 冯·达索等。,2000). 为了反映第二种解释,让我们定义相对稳健性系统相对于标称行为的鲁棒性除以其标称性能,即除以参考行为的满意度。哪里T型第页*表示系统未受干扰的标称行为。在图2,可以区分系统1和系统2相对于其标称性能的相对鲁棒性,反映出系统1中的性能受扰动的影响比系统2中的更大。系统3的性能函数等于系统1性能函数的一半。因此,这些系统就其标称性能而言具有相同的相对鲁棒性,尽管它们具有不同的绝对鲁棒性。 Gonze(消失)等。(2002)研究了低分子数对昼夜节律振荡周期的影响。随机模拟结果与相应确定性模型的行为进行了比较。周期被定义为蛋白质或mRNA浓度平均值连续两次向上交叉的时间间隔。人们可以使用我们的方法研究这种振荡,例如使用QFLTL公式F类(x个<米∧X(X)(x个>米)∧时间=t吨1∧F类(x个<米∧X(X)(x个>米)∧时间=t吨2))∧t吨2负极t吨1<b条表示两次连续向上穿越事件之间的最大时间小于b条,使用米的平均值x个,这需要事先计算。更复杂的时间行为,例如存在13个有丝分裂周期,随后G2停滞(Calzone等。,2007),可以类似地表达,然后使用我们的方法进行分析。
3.3稳健满意度
使用满意度域的概念,我们还可以定义与稳健满意度的距离关于一组摄动的性质P(P)作为距离(?)第页𝒟T型第页, ϕ). 该距离反映了公式中的最小变化,从而适用于全部的扰动。然后,我们定义稳健满意度作为: 这个概念允许我们区分是否可以放宽规范以满足所有扰动。在图1c、 可以保证系统始终呈现(可能是次优的)行为。此外,最近的财产非常满意(即可以为系统的设计提供有趣的提示:因为,这表明只有第一个值(单位:[答]在T中)需要修改。
在电池中等。(2007)提出了一种方法来检查合成转录级联的(模型)是否满足给定参数集的输入/输出稳态特性。更准确地说,对于给定集合中的所有参数,都要求如果诱导剂浓度低(u个自动变速箱<100),则在稳定状态下,荧光较低(x个环境足迹计划<500),如果诱导剂浓度高(u个自动变速箱>400),那么稳态荧光也是如此(x个环境足迹计划>500000). 当考虑QFLTL公式时(米,M(M))=u个自动变速箱<100→FG公司(x个环境足迹计划<米)∧u个自动变速箱>400→FG公司(x个环境足迹计划>M(M)),还可以找到属性所有参数都满足。这可以通过计算所有满意度域的交集来实现第页𝒟T型第页,ϕ.房地产的稳健满意度(米,M(M))提供了一个指标,表明我们的需求与强大的满足程度有多接近。
3.4实施
用于计算R(右)秒ϕ,P(P),R(右)秒,第页*ϕ,P(P)和Rsd(卢比)秒ϕ,P(P)需要区分扰动集是有限的(例如基因敲除)还是无限的(例如正态分布参数变化)。在第一种情况下,可以精确计算值,而在第二种情况下可以通过对足够多的扰动集进行采样来估计值。
以下算法在免费提供的工具BIOCHAM的2.8版中实现,该工具是用于分析生物系统(Calzone)的建模环境等。,2006). 给定ODE模型如果,一套P(P)初始条件或参数的扰动,以及(QF)LTL特性(年),该工具计算特性相对于给定扰动的鲁棒性、相对鲁棒性和鲁棒满意度。轨迹的计算T型第页通过数值积分完成。满意度域的计算T型第页,ϕ(年)通过对公式结构的归纳,为每个子公式直接实现定义。使用标准多面体库(Bagnara)在BIOCHAM中实现多面体操作等。,2008).
4在转录级联鲁棒性分析中的应用
我们考虑设计一个合成转录级联,用于合成生物学应用中事件的时间序列。这个瀑布是由Hooshangi及其同事建造的(2005)在这里,我们研究了期望行为的健壮性,以及使其更健壮的可能性。为此,在引入系统后,我们形式化了预期行为,开发了一个考虑到观察到的可变性的系统模型,并应用前面介绍的方法来研究预期属性的稳健性。
4.1系统描述
我们认为转录抑制的级联大肠杆菌(胡香木等。,2005). 网络表示为图3a.它由四个基因组成:四氯化碳,lacI公司,计算机接口和环境足迹计划分别编码三种阻遏蛋白,TetR、LacI和CI,以及荧光蛋白EYFP。由于EYFP蛋白,系统的荧光是测量的输出。该系统可以通过在生长介质中添加或移除小扩散分子aTc来控制。更准确地说,aTc与TetR结合并减轻对lacI公司因此,aTc浓度可作为系统的可控输入。很明显,系统在稳定状态下的输出(即荧光)对于低输入(即aTc浓度)为低,对于高输入为高。此外,研究表明,系统对诱导剂添加的时间响应的特征是荧光快速增加,之前有明显的滞后相。不幸的是,还观察到了细胞间的高变异性。细胞反应的异质性使得很难将该系统用作生物计时器,例如用于胡香木提出的发育程序等。(2005). 在这种情况下,对于许多合成生物学应用来说,即使细胞发送信号的比例很低,也可能会过早或过长,从而影响整个系统的正常运行。我们的目标是精确地研究获得一个强大的“定时”系统的可能性,即确保所有细胞确实会在给定的时间窗口内改变状态。
图3。
合成转录级联。(一)TetR抑制lacI公司,LacI抑制计算机接口CI抑制环境足迹计划.aTc控制lacI公司由TetR编制。蛋白质EYFP的荧光是输出。(b条)“适时”行为的图形表示:荧光保持在10以下三直到时间t吨1,超过105经过一段时间t吨2并在Δt吨时间。人们期望t吨1>150,t吨2<450和Δt吨<150.交叉代表Hooshangi的实验数据等。(2005).
4.2指定预期行为
这里,我们认为,如果荧光保持在10以下,则系统是适时的三至少150分钟,然后超过10分钟5最多450分钟后,从低水平快速切换到高水平,即不到150分钟。这些规格与实验观察到的细胞群体行为一致。这些规范用图形表示图3b并且可以在时序逻辑中形式化如下:它被抽象为用于计算给定轨迹中的有效域和满意度。 4.3系统可变性建模
有许多方法可以对细胞变异性建模(参见Manninen示例等。,2006). 我们的目标是构建一个简单的模型,使预测的行为和标准偏差与可用的实验数据一致。我们首先开发了一个类似于Batt的简单ODE模型等。(2007)而是使用Hill函数,参数与实验数据相吻合(图4a和B)。这些参数参考值表示为第页*在续集中。其次,我们考虑了建模细胞变异性的各种方法,包括带有加性或乘性噪声的随机微分方程,以及带有(对数)正态分布的随机参数变异。我们在对数正态分布参数的预测和观测平均值与标准偏差之间取得了良好的定性和定量一致性,如所示图5所以我们选择这些对数正态参数分布作为我们的“扰动模型”。使用随机微分方程或正态分布参数,我们无法在模型预测和实验观测之间找到一致性(数据未显示)。这可以部分解释为细胞间变异性很高。特别是,在某个时间点,观测到的变异系数达到1.4,这意味着标准偏差高于平均值。
图4。
(一)转录级联的ODE模型。蛋白质LacI、CI、EYFP和aTc的浓度表示为x个lacI公司,x个计算机接口,x个环境足迹计划和u个aTc公司分别是。假定组成性表达蛋白TetR的浓度恒定。(b条)参考参数值第页*和(c(c))参数分布建模系统的可变性。σ是噪声强度参数向量。
图5。
(一)添加aTc后荧光的时间演变。十字、虚线和实线代表Hooshangi的实验数据等。(2005),使用带有参考参数的ODE模型获得的预测第页*,以及分别使用对数正态分布参数对ODE模型进行5000次数值模拟的平均值。(b条)添加aTc后荧光变化系数的时间演变。十字和实线表示从Hooshangi的实验数据中获得的变异系数等。(2005)以及对具有对数正态分布参数和平均值的ODE模型进行的5000次数值模拟第页*分别是。(c(c))对数正态分布参数ODE模型的数值模拟第页*. (d日)扰动转录级联模型5000条数值轨迹的满意度分布。相应的稳健性为.
4.4提高期望行为的稳健性
在指定了“适时”行为并找到ODE模型和扰动模型后,我们想知道系统是否稳健地适时,以及在何种程度上。当考虑16维参数空间中5000个对数正态分布参数值时,我们估计系统的鲁棒性为:规范未得到充分满足。正如预期的那样,该属性保留引用参数值第页*(即。标准偏差(T型第页*,)=1),因此鲁棒性和绝对鲁棒性相等(). 满意度的分布表示为图5d、 这表明尽管大多数定时跟踪满足规范,但情况并非总是如此。平均而言,每个数值模拟持续150 ms,每个满意度计算持续50 ms(~500个时间点/轨迹;双核,2 GHz,2 GB RAM)。对于这种应用和我们的所有计算,限制因素是数值模拟。
如前所述,对于大多数合成生物学应用,需要一个更强大的计时器。我们能否找到其他参数以提高系统对类似参数扰动的鲁棒性?为此,我们使用最先进的非线性优化工具CMAES,该工具使用协方差矩阵自适应进化策略Hansen和Ostermier(2001),使用稳健性作为优化标准(即作为适应度函数)。我们发现以下参数值:,使用 原始参数之间的比较第页*和所谓的优化参数结果表明,EYFP生产率和希尔系数η显著增加。考虑到人们希望确保低状态和高状态之间的快速转换,这些参数显然是优化的目标。由于调整Hill系数在实验上很困难,因此我们寻找并找到了Hill系数不变的参数,以确保稳健的适时行为。
数值积分表明,实际获得的预期行为更加稳健(相比之下图5c和第6页). 有趣的是,变异系数表明,当时间限制保持不变(对于时间<150),否则显著增加(150<时间<450,参见图6b) ●●●●。研究此功能是否系统地出现在参数变化中,以提高所需行为的稳健性,将是一件有趣的事情。这可以揭示稳健性和脆弱性之间的权衡(北野,2004).
图6。
5000个对数正态分布参数ODE模型的数值模拟. (一)添加aTc后荧光的时间演变。(b条)荧光变化系数的时间演变。十字和实线表示从Hooshangi的实验数据中获得的变异系数等。(2005)和数值模拟结果。
4.5参数对稳健行为的影响
为了更全面地了解预期行为的稳健性变化,我们对参数空间进行了大参数变化的采样,并对每个参数进行了稳健性计算。
更准确地说,我们考虑参数空间上以参考参数值为中心的网格第页*对应于两个参数(κ)的±10倍参数变化环境足迹计划和γ;2D网格)或八个参数(κ0,κ、γ和u个自动变速箱; 8D网格)。然后,对于作为相对稳健性计算参考值的每个网格点,我们估计了当所有16个参数都变化时网络行为的稳健性。请注意,我们将初始aTc浓度视为一个参数。γ参数对应于所有降解参数γ的比例因子lacI公司, γ计算机接口和γ环境足迹计划,带γ*=1.它用于评估生长速率变化的影响,类似地影响所有蛋白质稀释率,从而影响所有降解率。鲁棒性基于50个扰动(即参数)进行估计,在快速收敛的情况下,估计值小于50。
对于二维栅格,可以直观地显示结果。在图7,满意度、稳健性和相对稳健性在(κ环境足迹计划,γ)参数空间。似乎γ的约束比κ的约束更严格环境足迹计划.无论是满意度还是稳健性,γ都必须保持在一个较窄的区间内,而κ环境足迹计划只是必须超过某个值。这一结果可以用以下事实来解释:高荧光蛋白产生率有助于系统产生快速而显著的反应,而蛋白质降解率γ的变化对行为有细微影响,因为它降低了荧光蛋白及其阻遏物的浓度。似乎名义行为,甚至是平均行为,对于增长率的变化来说相当脆弱。
图7。
(一)满意度(b条)稳健性和(c(c))(κ)表示的相对稳健性环境足迹计划,γ)参数空间。
稳健性环境看起来就像满意度环境的模糊版本。这对应于这样一个事实,即用于计算鲁棒性的细胞间变异性对应的参数变化通常小于探索参数空间时考虑的参数扰动。然而,还应强调的是,稳健性考虑了所有维度和特定分布中的参数变化(此处为对数正态,具有各种噪声强度σ)。因此,图7b不仅仅是模糊版本的图7a。
在图7c、 看起来,量化平均行为与名义行为之间差异的相对稳健性可以有效地识别满意度发生显著变化的区域。在系统设计的背景下,这些信息非常有趣。这可以与满意度对参数扰动的敏感性进行比较。然而,与灵敏度相反,相对鲁棒性考虑了给定的扰动模型。
在考虑更高维度的参数变化时,上述分析自然是不可能的。为了在8D网格上进行分析,我们使用了基于方差的全局敏感性方法(Saltelli等。,2004). 当一个度量(在我们的例子中是稳健性)受到几个参数变化的影响时,可以通过计算每个参数变化的重要性来进行统计评估灵敏度指数:这些敏感性指数和高阶敏感性指数量化了参数的变化P(P)我或一组参数对R(右). 我们认为8D网格定义如下。每个网格由三个参数值定义(第页我1,第页我2和第页我三)在每个维度上。这些值,或者更准确地说,它们的对数,是通过平均划分参数域[ln得到的(第页我/10) ,ln(10第页我)]在三个子区间中,通过在每个子区间中随机选择一个值。一阶和最重要的二阶灵敏度指数如下所示表1它们对应于在三个类似定义的网格上获得的平均值(每8D网格约20小时)。
表1。针对大参数变化的稳健性定义了一阶和最重要的二阶灵敏度指数,并在8D网格上进行了计算。
一阶灵敏度指数. | 二阶灵敏度指数. |
---|
S公司 γ | 20.2% | S公司 κ环境足迹计划,γ | 8.7% |
S公司 κ环境足迹计划 | 7.4% | S公司 κ计算机接口,γ | 6.2% |
S公司 κ计算机接口 | 6.1% | S公司 κ计算机接口0,γ | 5.0% |
S公司 κ0lacI公司 | 3.3% | S公司 κ计算机接口0,κ环境足迹计划 | 2.8% |
S公司 κ0计算机接口 | 2.0% | S公司 κ计算机接口,κ环境足迹计划 | 1.8% |
S公司 κlacI公司 | 1.5% | S公司 κ0环境足迹计划,γ | 1.5% |
S公司 κ0环境足迹计划 | 0.9% | S公司 κ0计算机接口,κ计算机接口 | 1.1% |
S公司 无人机通信 | 0.4% | S公司 κ0计算机接口,κlacI公司 | 0.5% |
第一笔订单合计 | 40.7% | 二阶总计 | 31.2% |
一阶灵敏度指数. | 二阶灵敏度指数. |
---|
S公司 γ | 20.2% | S公司 κ环境足迹计划,γ | 8.7% |
S公司 κ环境足迹计划 | 7.4% | S公司 κ计算机接口,γ | 6.2% |
S公司 κ计算机接口 | 6.1% | S公司 κ计算机接口0,γ | 5.0% |
S公司 κ0拉奇 | 3.3% | S公司 κ计算机接口0,κ环境足迹计划 | 2.8% |
S公司 κ0计算机接口 | 2.0% | S公司 κ计算机接口,κ环境足迹计划 | 1.8% |
S公司 κlacI公司 | 1.5% | S公司 κ0环境足迹计划,γ | 1.5% |
S公司 κ0环境足迹计划 | 0.9% | S公司 κ0计算机接口,κ计算机接口 | 1.1% |
S公司 无人机通信 | 0.4% | S公司 κ0计算机接口,κlacI公司 | 0.5% |
第一笔订单总额 | 40.7% | 二阶总计 | 31.2% |
表1。针对大参数变化的鲁棒性定义的一阶和最有效的二阶灵敏度指数,并在8D网格上计算。
一阶灵敏度指数. | 二阶灵敏度指数. |
---|
S公司 γ | 20.2% | S公司 κ环境足迹计划,γ | 8.7% |
S公司 κ环境足迹计划 | 7.4% | S公司 κ计算机接口,γ | 6.2% |
S公司 κ计算机接口 | 6.1% | S公司 κ计算机接口0,γ | 5.0% |
S公司 κ0lacI公司 | 3.3% | S公司 κ计算机接口0,κ环境足迹计划 | 2.8% |
S公司 κ0计算机接口 | 2.0% | S公司 κ计算机接口,κ电子飞行计划 | 1.8% |
S公司 κlacI公司 | 1.5% | S公司 κ0环境足迹计划,γ | 1.5% |
S公司 κ0环境足迹计划 | 0.9% | S公司 κ0计算机接口,κ计算机接口 | 1.1% |
S公司 无人机通信 | 0.4% | S公司 κ0计算机接口,κlacI公司 | 0.5% |
第一笔订单合计 | 40.7% | 二阶总计 | 31.2% |
一阶灵敏度指数. | 二阶灵敏度指数. |
---|
S公司 γ | 20.2% | S公司 κ环境足迹计划,γ | 8.7% |
S公司 κ环境足迹计划 | 7.4% | S公司 κ计算机接口,γ | 6.2% |
S公司 κ计算机接口 | 6.1% | S公司 κ计算机接口0,γ | 5.0% |
S公司 κ0lacI公司 | 3.3% | S公司 κ计算机接口0,κ环境足迹计划 | 2.8% |
S公司 κ0计算机接口 | 2.0% | S公司 κ计算机接口,κ环境足迹计划 | 1.8% |
S公司 κlacI公司 | 1.5% | S公司 κ0环境足迹计划,γ | 1.5% |
S公司 κ0环境足迹计划 | 0.9% | S公司 κ0计算机接口,κ计算机接口 | 1.1% |
S公司 无人机通信 | 0.4% | S公司 κ0计算机接口,κlacI公司 | 0.5% |
第一笔订单合计 | 40.7% | 二阶总计 | 31.2% |
对一阶灵敏度指数的分析证实了我们之前的发现,即γ变化对级联的稳健行为有非常强烈的影响。仅此参数的变化就造成了20%的鲁棒性变化。相反,aTc变化似乎对级联行为的影响很小。虽然这似乎与输入/输出行为的超敏性相矛盾(Hooshangi等。,2005)它只是表明用于诱导级联的aTc浓度高到足以使网络对更大的aTc变化不敏感。
该分析的一个令人惊讶的结果是,基础和调节EYFP产生率的变化具有非常不同的重要性,κ0环境足迹计划和κ电子飞行计划(表1). 鉴于规范对“低”和“高”EYFP水平施加了类似的限制,并且这些水平与比率κ成比例,处于温和近似值下0环境足迹计划/γ环境足迹计划和κ环境足迹计划/γ环境足迹计划分别地,人们可以预期κ的敏感性指数相似0环境足迹计划和κ环境足迹计划事实上,低EYFP水平也依赖并以非线性方式依赖CI的稳态值,其本身与κ成正比计算机接口/γ计算机接口.因为κ计算机接口变异对级联的稳健行为有强烈影响,我们的结果表明,当未诱导时,EYFP的基础生成是由于CI对启动子的不完全抑制,这解释了κ计算机接口差异,而不是启动子的结构性泄漏,解释了κ的低效应环境足迹计划0变化。该假设也与我们发现的二阶敏感性指数相一致:S公司κ计算机接口, γ>S公司κ0电子飞行计划,γ.
二阶灵敏度指数分析表明,产量和降解率的联合变化在稳健性变化中起着重要作用。这并不奇怪,因为如前所述,比率κ我/γ我在很大程度上决定了蛋白质的稳态水平。
5讨论
我们提出了一个通用的计算框架,用于定义生物函数对一组扰动的鲁棒性。该框架是通用的,因为它适用于(i)任何可在时序逻辑LTL中表达的生物函数,LTL是一种用于指定计算机科学和工程中广泛使用的动力学行为的表达语言,以及(ii)任何扰动集,前提是扰动系统的行为可以作为数值时间轨迹获得,例如通过ODE的数值积分。在此设置中,鲁棒性的计算是完全自动化的,并在自由软件BIOCHAM(Calzone)中实现等。,2006). 当形式化稳健性概念时,我们发现可以提出几个定义。人们可以显著区分绝对鲁棒性,量化受扰系统的平均性能,以及相对鲁棒性,定量因扰动导致的性能退化/改善。为了说明我们的方法的适用性并证明其生物学相关性,我们考虑了提高转录级联对添加诱导物的时间反应的稳健性的可能性。细胞间的显著差异使得很难将此系统用作合成生物学应用的可靠生物计时器。我们发现参数修改可以稳健地获得所需的定时行为。此外,我们还探讨了可能的大参数变化对所需行为鲁棒性的影响。通过全局灵敏度分析,我们获得了一些有趣的结果,这些结果可能有助于系统的优化。
我们方法的核心是满意度时间逻辑公式。在系统和合成生物学中,许多计算方法使用相当简单的系统性能度量,用于参数搜索、鲁棒性计算或局部和全局灵敏度分析。找到系统性能的相关度量限制了上述方法的适用性。此类测量的示例包括响应增益、稳态扰动或振荡周期扰动(Felix和Wagner,2008; 冯等。,2004; Gonze(消失)等。,2002). 相反,使用满意度作为性能度量,可以利用时序逻辑的表达能力,从而大大扩展这些技术的适用性。在里兹克等。(2008),我们表明,使用满意度,可以有效地找到观察到复杂动力学行为的参数值。在本文中,我们展示了如何使用相同的概念来定义和估计LTL中可表达的任何动态行为相对于一组扰动的鲁棒性,以及如何应用全局敏感性分析来发现参数变化对预期行为的任何LTL规范的鲁棒性的影响。已经提出了使用时序逻辑来定义生物系统鲁棒性的其他方法(Batt等。,2007; 沈等。,2008). 然而,这些方法使用时态逻辑的布尔解释,而mboxis并不适合定义稳健性的定量概念。
鲁棒性和可进化性以及鲁棒性和模块性之间的关系在系统生物学中得到了广泛的研究(Ciliberti等。,2007; 北野,2004). 然而,在合成生物学中,并没有太多的工作集中于稳健性分析。由于显而易见的原因,在细胞变异和环境波动的情况下实现稳健的行为是合成生物学的中心问题。因为大型合成网络很可能是模块化的(Chin,2006; 麦克丹尼尔和韦斯,2005)我们可以设想一种方法,其中每个模块都被设计为稳健地呈现给定的行为,从而可以保证当包含在更复杂的系统中时,模块仍能按预期工作。在这种情况下,输入/输出鲁棒性(Shinar等。,2007)和绝缘(Vecchio等。,2008)都是特别有趣的概念。
致谢
我们感谢Ron Weiss、Priscilla Purnick和Weiss实验室的其他成员进行了富有成果的讨论并提供了实验数据。我们感谢欧洲项目Tempo、INRIA Colage和INRA AgroBi项目的部分支持。
利益冲突:未声明。
参考文献
等生化过程建模与模型检验
, 细胞生物化学。生物物理学。
, 2003
,卷。 38
(第271
-286
) 等Parma多面体库:为硬件和软件系统的分析和验证提供一整套数字抽象
, 科学。计算。程序。
, 2008
,卷。 72
(第三
-21
) , . 简单生化网络的鲁棒性
, 自然
, 1997
,卷。 387
(第913
-916
) 等通过模型检验验证遗传调控网络的定性模型:大肠杆菌营养应激反应分析
, 生物信息学
, 2005
,卷。 21
补充1
(第i19号机组
-i28号机组
) 等合成基因网络的鲁棒性分析与调谐
, 生物信息学
, 2007
,卷。 23
(第2415
-2422
) 等形式化方法在生物调控网络中的应用:用时序逻辑扩展Thomas的异步逻辑方法
, J.西奥。生物。
, 2004
,卷。 229
(第339
-347
) 等BIOCHAM:一个模拟生物系统和形式化实验知识的环境
, 生物信息学
, 2006
,卷。 22
(第1805
-1807
) 等中合胞体有丝分裂周期的动力学模拟果蝇胚胎
, 摩尔系统。生物。
, 2007
,卷。 三
第页。 131
, . . 生化网络的符号模型检验
, 《系统生物学计算方法汇编》(CMSB'03)。
, 2003
,卷。 2602
柏林
施普林格
(第149
-162
) 等参数空间的几何和拓扑:研究调节网络的鲁棒性度量
, 数学杂志。生物。
, 2007
,卷。 104
(第13591
-13596
) . 扩展生物功能的模块化方法
, 自然化学。生物。
, 2006
,卷。 2
(第304
-311
) 等复杂调控基因网络中的创新和稳健性
, 程序。美国国家科学院。科学。美国
, 2007
,卷。 104
(第13591
-13596
) , . 发育基因调控网络的特性
, 程序。美国国家科学院。科学。美国
, 2008
,卷。 105
(第20063
-20066
) 等调节基因网络和发育过程的特性
, 程序。美国国家科学院。科学。美国
, 2003
,卷。 100
(第1475
-1480
) , . , . 生化通路参数估计的模型检验方法
, 第四届系统生物学计算方法国际会议论文集(CMSB'08)。
, 2008
,卷。 5307
柏林
施普林格
(第269
-287
) 等截断路径上的时序逻辑推理
, 第十五届计算机辅助验证会议(CAV'O3)会议记录。
, 2003
,卷。 2725
施普林格
(第27
-39
) 等抗热冲击:鲁棒性和性能的控制策略
, 程序。美国国家科学院。科学。美国
, 2005
,卷。 102
(第2736
-2741
) . . 时序和模态逻辑
, 理论计算机科学手册。
, 1990
,卷。 B类
剑桥
麻省理工学院出版社
(第995
-1072
) , . 数值数据时间序列分析的时序逻辑约束求解
, 西奥。计算。科学。
, 2008
,卷。 408
(第55
-65
) , . 等时序逻辑规范的稳健性
, 软件测试和运行时验证正式方法国际研讨会论文集(FATES/RV'06)。
, 2006
,卷。 4262
柏林
施普林格
(第178
-192
) , . , . MITL规范的稳健抽样
, 《第五届时间系统形式建模与分析国际会议论文集》(FORMATS’07)。
, 2007
,卷。 4763
柏林
施普林格
(第147
-162
) , . 健壮性和进化:发展模型系统的概念、见解和挑战
, 遗传
, 2008
,卷。 100
(第132
-140
) 等用全局灵敏度分析优化遗传电路
, 生物物理学。J。
, 2004
,卷。 87
(第2195
-2202
) 等昼夜节律相对于分子噪声的稳健性
, 程序。美国国家科学院。科学。美国
, 2002
,卷。 99
(第673
-678
) , . 进化策略中的完全失范自适应
, 进化。计算。
, 2001
,卷。 9
(第159
-195
) 等合成转录级联中的超敏性和噪声传播
, 程序。美国国家科学院。科学。美国
, 2005
,卷。 102
(第3581
-3586
) . 果蝇片段极性网络的拓扑结构和鲁棒性
, 《公共科学图书馆·生物》。
, 2004
,卷。 2
第页。 e123(电子123)
. 生物稳健性
, Nat.Rev.基因。
, 2004
,卷。 11
(第826
-837
) . 走向生物稳健性理论
, 摩尔系统。生物。
, 2007
,卷。 三
第页。 137
等果蝇片段极性网络的鲁棒性和模块化设计
, 摩尔系统。生物。
, 2006
,卷。 2
第页。 70
等等检查离散、定时和连续行为的时间属性
, 计算机科学支柱,专为B.Trakhtenbrot撰写的论文。
, 2008
,卷。 4800
施普林格
(第475
-505
) ,等人神经元信号转导途径的随机微分方程模型的建立
, 公司。生物化学。
, 2006
,卷。 30
(第280
-291
) , . 合成生物学进展:从原型到应用
, 货币。操作。生物技术。
, 2005
,卷。 16
(第476
-483
) , . , . AMT:模拟系统的基于属性的监控工具
, 时间系统的形式化建模和分析会议记录(FORMAT'07)。
, 2007
,卷。 4763
柏林
施普林格
(第304
-319
) 等, . 时序逻辑公式的连续满意度及其在系统生物学中的应用
, 第四届系统生物学计算方法国际会议论文集(CMSB'08)。
, 2008
,卷。 5307
柏林
施普林格
(第251
-268
) ,等人, 实践中的敏感性分析:评估科学模型指南。
, 2004
纽约
威利出版社
等细菌细胞周期控制系统的结构和固有鲁棒性
, 程序。美国国家科学院。科学。美国
, 2008
,卷。 105
(第11340
-11345
) 等简单细菌信号系统的输入输出鲁棒性
, 程序。美国国家科学院。科学。美国
, 2007
,卷。 104
(第19931
-19935
) 等细胞功能的稳健性
, 单元格
, 2004
,卷。 118
(第675
-685
) 等生物钟结构的鲁棒性
, 程序。美国国家科学院。科学。美国
, 2004
,卷。 101
(第13210
-13215
) 等模块化细胞生物学:追溯性和绝缘性
, 摩尔系统。生物。
, 2008
,卷。 4
第页。 161
等分段极性网络是一个强大的开发模块
, 自然
, 2000
,卷。 406
(第188
-192
) 等通过积分反馈控制实现细菌趋化性的稳健完美适应
, 程序。美国国家科学院。科学。美国
, 2000
,卷。 97
(第4649
-4653
)
©2009作者
这是一篇根据知识共享署名非商业许可条款发布的开放存取文章(http://creativecommons.org/licenses/by-nc/2.0/uk/)它允许在任何媒体上不受限制地进行非商业性使用、分发和复制,前提是正确引用了原作。