本文提出了一种利用作者最近提出的响应统计量实现参数估计方法的数值方法。该方法将漂移扩散的参数估计问题表述为非线性最小二乘问题。为了避免在使用迭代方案求解所产生的最小二乘问题时重复求解模型,在适当的响应统计上使用多项式代理模型,并平滑地依赖于参数。在基本统计量作为参数函数的适当正则性假设下,建立了收敛于真最小二乘问题解的近似多项式最小二乘问题的极小元的存在性。该方法的数值实现是在两个属于具有广泛应用的模型类的原型示例上进行的,包括朗之万动力学和随机强迫梯度流。讨论了几个重要的实际问题,如选择适当的响应算子以确保参数的可识别性和参数空间的缩减。从数值实验中发现,与使用平衡统计确定参数的传统方法相比,该方法具有更好的性能。

在许多动力学系统中,一些模型参数可能无法从其平衡统计中识别。对于可以从两点统计中识别参数的问题,本文提供了一种数值估计这些参数的方法。在数学上,我们将逆问题表示为一个适定的动态约束非线性最小二乘问题,该问题在小外部扰动下符合一组线性响应统计。由于直接求解这个问题在计算上是不可行的,我们考虑用多项式代理模型来近似这个最小二乘问题。在适当的正则性假设下,建立了近似问题解与原始非线性最小二乘解的收敛性。给出了具有广泛应用的两类模型的数值例子,即朗之万动力学和随机强迫梯度流。

参数估计在自然界建模中普遍存在。这个反问题的目标是从观测数据中推断出足够准确的参数,从而使得到的模型成为有用的预测工具。现有的参数估计技术通常属于以下两类方法之一,即最大似然估计1贝叶斯推理,如马尔可夫链蒙特卡罗(MCMC),2取决于有关参数的先前信息的可用性。由于模型参数通常不直接测量,任何推理方法的成功与否都关键取决于给定观测值中参数的可识别性。当观测值对参数的依赖性是隐含的,即通过模型进行敏感性分析(例如,参见综述文章)通常是确定参数可识别性的有用实用工具。

本文考虑布朗噪声驱动的遍历随机微分方程的参数估计。当动力系统的相应不变测度显式依赖于参数时,通常可以从适当的平衡统计矩推断出这些参数。利用这种思想的一种流行方法是反向蒙特卡罗方法4在化学中发展起来的。特别地,它通过匹配一些预选观测值的平衡平均值,建立了一个合适的非线性最小二乘积分方程组。随后,使用牛顿迭代法估计参数。在每个迭代步骤中,为Monte-Carlo估计生成当前参数估计的样本,以近似最小二乘积分方程和相应的雅可比矩阵。在实际中,由于重复采样过程,此方法可能会很慢。这种方法的一个严重局限性是,它限制了对平衡密度参数的推断。

通过拟合适当的两点统计数据,可以克服这一限制。如我们之前的工作所示,5我们提出了一个基于线性响应统计的参数估计问题,该问题是在外力的作用下,使系统失去平衡。波动分配理论(FDT)是非平衡统计物理的一个标志,它认为在小扰动下可观测平均值的变化可以用适当的两点统计来近似,称为FDT响应算子。6关键点是,这些FDT响应算子可以使用平衡的可用样本进行估计未受干扰的只要我们知道动力学不变量测度的精确形式,我们就会假设这是一大类问题的情况,例如朗之万动力学和随机梯度流。我们应该指出,所提出的方法依赖于FDT响应统计量的有效性,该统计量已在本文中针对包括随机微分方程(SDE)设置的一大类随机系统进行了严格研究。7例如,对于确定性动力学,可以使用参考文献。8验证FDT线性响应的有效性。遵循参考文献。911,我们使用参考文献。5。参考文献中的方法。9–11涉及到最小化依赖于均值和方差响应算子的信息理论泛函,我们的方法适用于有限数量的量,称为基本统计数据,这将允许我们近似适当可观测值的FDT响应操作符(超出平均值和方差)。

在我们之前的工作中,5我们通过三个例子证明了该公式的合理性,即在无限抽样下,适当选择基本统计量将确保模型参数的可辨识性。在其中一个例子中,湍流的简化模型,12这是一个具有高斯不变测度的SDE非线性系统,我们能够明确地确定可观测值和外部作用力的选择(这反过来决定了FDT响应算子),从而能够唯一地识别所有模型参数。在这种情况下,可以通过求解包含这些基本统计信息的方程组来直接估计参数。虽然这一结果表明,可观测值和外力的选择与问题有关,但FDT理论为选择合适的两点统计量进行合理的参数估计提供了指导。在另一个例子中,朗之万动力学(将在第。四、),而参数可以通过参考文献。5公式表明,必须包括涉及FDT响应算子的高阶导数的基本统计数据。这可能会有问题,因为除非可用数据是高阶SDE解算器的解,否则这些高阶统计在实践中很少可用。考虑到这个实际问题,我们建议只拟合包含FDT响应算子的零阶和一阶导数的基本统计(如果可能,只使用零阶导数信息)。仅限制低阶基本统计信息所付出的代价是,通过动力学模型的解,基本统计对某些模型参数的依赖性变得隐含,并且这些参数的可识别性变得可疑。

本文设计了一种具体的数值方法,通过求解含有这些低阶本质统计量的积分方程的动态约束最小二乘问题来估计参数。可以想象,这种方法的实施将面临几个挑战。首先,就像逆向蒙特卡罗方法一样,要想用迭代方法来解决这个动态约束最小二乘问题,需要反复求解模型。为了避免在最小化步骤中重复求解模型,我们采用多项式代理模型方法13,14关于涉及基本统计的最小二乘成本函数。这种方法的动机是成本函数(或有效的基本统计)受到抽样误差的影响,并且基本统计对参数具有平滑依赖性,假设基础动力学的福克-普朗克算子对参数具有光滑依赖性。在本质统计的适当正则性假设下,我们将为收敛于真最小二乘问题解的近似多项式最小二乘问题的极小元的存在性提供理论保证。如上所述,第二个相关问题是,某些(低阶)基本统计数据可能对某些参数不够敏感,这将导致不准确的估计。为了确保参数的实际可识别性,我们使用了一个经验先验的基于构建多项式代理模型所用训练数据的敏感性分析后部局部灵敏度分析,以确保先前灵敏度分析的有效性。

虽然所提出的技术可用于推断所有模型参数,但在实践中,应使用多项式近似来推断无法直接估计的参数,以避免维数灾难。此问题是使用多项式展开来近似最小二乘问题的结果,其中构建代理模型所需的训练数据集随着参数维的函数呈指数增长。在下面的数值示例中,我们将应用近似最小二乘问题来估计无法从匹配平衡和/或涉及FDT响应算子一阶导数的两点统计直接估计的参数。

论文的其余部分组织如下。在第。,我们简要回顾了基本统计的概念和使用参考文献。5.秒。,我们提出了基于多项式代理模型的数值算法,并讨论了其收敛性(在附录A– C类). 以秒为单位。四、V(V),我们分别在两个非线性示例上显示了应用,即Langevin模型和具有三重势的随机梯度系统。在第。最后,我们对本文进行了总结和讨论。

我们首先回顾了我们在前一篇论文中介绍的参数估计公式。5考虑一个n个-维扩散

d日X(X)=b条(X(X);θ)d日t吨+σ(X(X);θ)d日W公司t吨,
(1)

其中向量场b条(X(X);θ)表示漂移和σ(X(X);θ)是扩散张量。假设两个系数都是平滑函数X(X)θ;W公司t吨表示标准Wiener过程,变量θ包含模型参数,其中R(右)N个是参数域。在本文中,我们只考虑以下情况是有界的,为了简单起见,我们假设=[1,1]N个。在本文中,我们将底层的真参数值表示为θ相应的估算为θ^.我们假设等式。(1)遍历(参见参考。15精确条件下)具有平衡密度第页e(电子)q个(x个;θ)为所有人θ、和第页e(电子)q个(x个;θ)能否顺利取决于这两者x个θ.何时θ=θ,我们假设我们可以访问第页e(电子)q个(x个;θ)作为的函数x个仅,缩写为第页e(电子)q个(x个)正如我们将在许多应用中看到的那样,第页e(电子)q个(x个;θ)仅取决于参数的子集θ.

参考文献中介绍的参数估计公式的主要思想。5是从与涨落耗散理论(FDT)相关的线性响应算子中推断参数。回想一下,在FDT设置中,我们对订单感兴趣-δ(0<δ1)形式的外部扰动(f)(x个,t吨)=c(c)(x个)δ(f)(t吨),这样摄动动力学的解

d日X(X)δ=[b条(X(X)δ,θ)+c(c)(X(X)δ)δ(f)(t吨)]d日t吨+σ(X(X)δ,θ)d日W公司t吨,

否则将保持在未扰动动力学的平衡状态(1)可以用扰动密度来表征第页δ(x个,t吨;θ)在初始条件下,密度函数由相应的福克-普朗克方程控制第页δ(x个,0;θ)=第页e(电子)q个(x个;θ).

通过标准扰动技术,例如参考。1,任何可积函数的扰动统计和未扰动统计之间的差异A类(x个)可以通过卷积积分来估计,即,

ΔE类[A类](t吨):=E类第页δ[A类(X(X))](t吨)E类第页e(电子)q个[A类(X(X))]=0t吨k个A类(t吨)δ(f)()d日+O(运行)(δ2).
(2)

(2),术语k个A类(t吨)称为线性响应算子。FDT将线性响应算符公式化为以下两点统计:

k个A类(t吨;θ):=E类第页e(电子)q个{A类[X(X)(t吨)]B类[X(X)(0);θ]}具有B类(X(X);θ):=X(X)[c(c)(X(X))第页e(电子)q个(X(X);θ)]第页e(电子)q个(X(X);θ),
(3)

哪里B类c(c)表示第个的组件B类c(c)分别是。我们应该指出,FDT的有效性已经在温和的条件下进行了严格的研究。7更明确的形式如下所示

k个A类(t吨;θ)=R(右)n个R(右)n个A类(x个)B类()ρ(x个,t吨|,0)第页e(电子)q个(;θ)d日x个d日,
(4)

哪里ρ是福克-普朗克方程的解

t吨ρ=L(左)ρ,ρ(x个,0|,0)=δ(x个).
(5)

在这里,L(左)表示未扰动动态的发生器(1)L(左)是它的伴随运算符L(左)2(R(右)n个).

备注2.1

参考中的结果。16说明如果线性抛物线偏微分方程的系数为C类k个作为的功能θ,那么弱解也是k个-关于时间可微分θ在我们的情况下,如果b条,σC类k个([1,1]N个),然后是线性响应算子k个A类(t吨;θ)(4)也是C类k个关于参数θ在温和的假设下第页e(电子)q个(x个;θ)在以下方面是平滑的θ第节。III B类,我们将对提出的参数估计方法进行收敛性分析,以确定k个,线性响应算子作为函数的光滑性θ.

请注意B类(X(X)):=B类(X(X);θ)可以根据我们假设知道的显式公式解析地确定第页e(电子)q个.给定t吨,的值k个A类(t吨;θ)可以使用基于未扰动系统时间序列的蒙特卡罗和进行计算,X(X),于第页e(电子)q个(x个)因此,可以在不知道以下未扰动系统的情况下估计线性响应算子(1)只要时间序列X(X)第页e(电子)q个(x个)并且这个平衡密度的显式公式是已知的。

FDT以及核函数的表达式(3),已实施到预测可观察到的预期的变化A类.17–22其优点是响应算子是根据平衡分布定义的,这不涉及扰动密度的先验知识第页δ在统计物理中,FDT是推导输运系数的关键公式,例如电子电导率、粘度、扩散系数等。6然而,在当前的论文中,我们建议使用响应统计推断底层的真实参数值θ.

由于该线性响应算子在原则上是无限维的,因此有必要引入有限维近似。响应算子的以下参数形式是由拉普拉斯变换的有理逼近引起的。23为了解释这个想法,请考虑k个A类(t吨;θ)记为K(;θ),可以用有理函数近似如下:

K(;θ)(1β1·β)1(1α1+·+α),α,βR(右)n个×n个.

在时域中,k个A类(t吨;θ)可以显式编写为

k个A类(t吨;θ)(t吨;θ):=(0·0)e(电子)t吨G公司(α1α2α),具有G公司=(β1β20β0),
(6)

哪里表示n个-由-n个单位矩阵。这里,表示有理逼近的阶数。参考文献。23有理逼近中的系数是根据一定的插值条件确定的,并且这种有理逼近已被证明是时间相关函数的良好逼近。对于当前的问题,将使用如下定义的有限多个基本统计数据来确定。

定义2.2

价值观{k个A类(j个)(t吨;θ)}=1,2,,K被称为基本统计数据如果它们足以近似响应运算符k个A类(t吨;θ)符合订单要求-使用(6),用于j个=0,,21t吨1<t吨2·<t吨K,哪里j个表示导数的顺序。

备注2.3

参考文献。5,我们考虑了k个A类t吨=0对于朗之万动力学模型,并找到了涉及模型参数的显式公式。理论上,所有参数都可以从{k个A类(j个)(0+;θ)},这在一定程度上显示了一致性。然而,在实践中,我们只使用不大于1的阶导数,自估计高阶导数k个A类(t吨,θ)需要时间序列X(X)(t吨)具有足够的准确性,不一定可用。通过使用与低阶导数相对应的基本统计数据t吨非零,我们给出了关于参数的高阶统计量的显式表达式。这促使我们用最小二乘法来解决这个问题。此外,它需要其他更实用的方法,比如敏感性分析测试,从这些统计数据中确定参数的可识别性。

图1显示了这种离散表示的性能,其中线性响应算子来自受到恒定外力作用的Langevin模型(25),将在第。四、通过这种离散表示,我们减少了从无限维推断的问题k个A类(t吨;θ)到有限数量的基本统计数据。导出一个包含这两者的方程组θ以及这些重要的统计数据,我们将介绍

k个^A类(t吨;θ):=E类第页e(电子)q个(θ){A类[X(X)(t吨)]B类[X(X)(0)]}.
(7)

我们还定义了j个=0,1,

M(M)j个(t吨):=k个A类(j个)(t吨;θ)=d日j个d日t吨j个E类第页e(电子)q个{A类[X(X)(t吨)]B类[X(X)(0)]}.

我们应该强调这一点(7)不是FDT响应,因为B类(x个)在里面(7)定义与第页e(电子)q个参考文献中的关键思想。5是估计真实的参数值θ通过求解

M(M)j个(t吨)=k个^A类(j个)(t吨;θ),j个{0,1},=1,2,,K.
(8)

这里,左侧的术语是根据以下可用样本估计的第页e(电子)q个,右侧的项将根据求解生成的时间序列计算(1)对于给定的θ.

图1。

响应函数(实线)及其四阶近似值(虚线)。

图1。

响应函数(实线)及其四阶近似值(虚线)。

关闭模态
备注2.4

第页e(电子)q个通常取决于真实参数值的子集θ,知道的显式形式的假设第页e(电子)q个作为的函数x个只是太强大了。一般来说,我们甚至无法计算(8)自任期以来B类,这可能取决于未知的真值θ,不可用。我们将在Secs中的两个示例中讨论如何解决此类问题。四、V(V),其中每个模型都属于一类具有广泛应用的模型。

为了确保可解性,我们假设(8)总是大于未知参数的维数θ。对于这种过于确定的情况,我们建议解决(8)在最小二乘法意义上,解决参考文献。5当显式解不可用时。求解非线性最小二乘问题的主要困难来自评估k个^A类(j个)(t吨;θ),这通常需要求解模型(1)重复。以秒为单位。,我们将提出一种有效的数值方法来解决这个问题。

以秒为单位。,我们将参数估计方法表述为求解非线性系统的问题(8)在中受动态约束(1).在紧凑形式中,我们表示系统(8)作为

(f)(θ):=M(M)0(t吨)k个^A类(t吨;θ)=0,=1,,K,
(9)

哪里θ[1,1]N个,K>N个注意,我们忽略了(8)虽然如下所示的类似算法和收敛结果也适用于最小二乘程序中包含一阶导数约束的情况,但我们将只数值求解零阶导数约束下的最小二乘问题,如(9)我们将在秒中看到。四、V(V),我们将使用导数约束直接估计一些参数。

我们的目标是解决(9)在最小二乘意义下,即,

最小值θ[1,1]N个=1K(f)2(θ).
(10)

然而,正如我们在第。,我们不一定有(f)(θ)和评估(f)对于的某些值θ需要求解真实模型(1)近似积分(f)(θ)蒙特卡洛总和。例如,如果我们应用Gauss-Newton方法来解决非线性最小二乘问题(10),由于我们必须求解模型,因此整体计算将变得非常昂贵(1)重复。作为补救,我们应用了参考文献中介绍的基于多项式的代理模型的思想。1314用于解决贝叶斯推理问题,以减轻这部分计算量。我们的方法与参考文献的主要区别。1314他们使用正交多项式来扩展动力学模型,X(X)(t吨,θ),而在这里,我们将使用正交多项式展开(f)(θ)而贝叶斯推理问题的近似后验密度估计的收敛性在参考文献。14,我们将通过分析近似最小二乘问题的收敛性来结束本节。

我们方法的核心思想是近似(f)(θ)通过多项式函数(f)M(M)(θ)这是因为在计算基本统计值时无法避免抽样误差,也就是说(8)因此,更合理的做法是考虑(10)作为具有一定分布的随机变量μ结束[1,1]N个此外,由于{(f)(θ)}C类k个关于θ(备注2.1)无论何时b条σ在里面(1)C类k个关于θ,多项式混沌展开提供了(f)M(M)(θ)基于关于μ.

例如,如果我们考虑μ单位[1,1],即均匀分布,则相应的正交多项式为勒让德多项式{第页n个}。它们由提供第页0=1,第页1=x个,以及递归公式

(n个+1)第页n个+1(x个)=(2n个+1)x个第页n个(x个)n个第页n个1(x个),

它们构成了L(左)2([1,1],μ).的正交性{第页n个}结束L(左)2([1,1],μ)由描述

11第页(x个)第页n个(x个)d日μ(x个)=22n个+1δn个.

可以正常化第页n个通过引入P(P)n个:=第页n个n个+12.

对于多维情况,可以定义P(P)k个(θ):=πj个=1N个P(P)k个j个(θj个)(N个表示的尺寸θ),其中k个0是具有的多索引k个=(k个1,,k个N个){0,1,2,}N个θ=(θ1,,θN个)[1,1]N个.我们可以考虑订购-M(M)近似值(f)(θ)

(f)(θ1,,θN个)k个M(M)αk个()P(P)k个(θ)=:(f)M(M)(θ).
(11)

实际上,有两种方法可以确定系数αk个()第一种方法是Galerkin方法,它要求近似中的误差(11)与有限维子空间正交L(左)2([1,1],μ)由生成{P(P)k个(θ)}k个M(M)在收敛性分析中,我们将根据通过Galerkin(或最小二乘)拟合获得的系数推导误差估计。或者,可以确定系数αk个()通过配置方法,即匹配(f)在…的某些点θ在里面,表示为Θ,得出以下线性方程:

(f)(θ)=k个M(M)αk个()P(P)k个(θ),θΘ.
(12)

(12)相当于多项式插值,通常选择Θ是订单的产品空间-M(M)C类切比雪夫节点,其中M(M)C类M(M)+1[何时M(M)C类>M(M)+1,(12)变成线性最小二乘问题]。在本文的数值例子中,我们将使用配置法来确定系数。

更换(f)(θ)在里面(10)通过(f)M(M)(θ),我们得到了订单的一个新的最小二乘问题-M(M)基于多项式的代理模型

最小值θ[1,1]N个=1K((f)M(M))2(θ).
(13)

为了更简单地表示,让我们使用(f)M(M)(θ)JM(M)(θ)表示向量值函数,[(f)1M(M)(θ),,(f)N个M(M)(θ)],及其雅可比矩阵。

总之,我们有基于Gauss-Newton方法的算法1。

算法1。

参数估计:基于多项式的代理模型

Θ是中的一组搭配节点[1,1]N个
1.对于每个θΘ,解决(1)
2.估算(f)(θ)使用Monte-Carlo和=1,,K
3.计算系数αk个()通过求解线性系统(12)并获得近似值(f)M(M)(θ)对于=1,,K. 
4.对于初步猜测θ0[1,1]N个和阈值δ>0.计算
θk个=θk个1{[JM(M)(θk个1)]JM(M)(θk个1)}1[JM(M)(θk个1)](f)M(M)(θk个1).
(14)
 
虽然步长θk个θk个1δ 
重复(14)
结束while 
返回θk个 
Θ是中的一组搭配节点[1,1]N个
1.对于每个θΘ,解决(1)
2.估算(f)(θ)使用Monte-Carlo和=1,,K
3.计算系数αk个()通过求解线性系统(12)并获得近似值(f)M(M)(θ)对于=1,,K. 
4.对于初步猜测θ0[1,1]N个和阈值δ>0.计算
θk个=θk个1{[JM(M)(θk个1)]JM(M)(θk个1)}1[JM(M)(θk个1)](f)M(M)(θk个1).
(14)
 
虽然步长θk个θk个1δ 
重复(14)
结束while 
返回θk个 

计算上,最昂贵的步骤是求解(1)关于搭配节点Θ,可以并行完成。

在本节中,我们将在中提供近似最小二乘问题解的收敛性分析(13)中真最小二乘问题的求解(10)作为M(M),在适当的条件下。我们表示(13)通过θM(M)也就是说,

θM(M):=参数最小值θ[1,1]N个=1K((f)M(M))2(θ).

自每个(f)M(M)是多元多项式,最小值(13)可以在[1,1]N个; 但是这样θM(M)可能不是唯一的。对于以下情况K=N个并且足够光滑(f),假设参数值为真θ(1,1)N个是真最小二乘问题的唯一解(10),我们可以证明近似问题存在一系列极小值(13){θM(M)}这样的话θM(M)θ作为M(M)+更准确地说,

在我们应用数值方法解决问题之前,一个基本问题是:假设θ(1,1)N个,真正的参数值,是(10)我们能找到近似问题的极小值序列吗(13){θM(M)}这样的话θM(M)θ作为M(M)+? 我们能够证明以下定理,它部分地回答了这个问题。

定理3.1
考虑一下N个-多维非线性最小二乘问题(10)及其代理模型(13)特别是,我们让K=N个并假设
  1. (f)C类([1,1]N个),=2N个+2,=1,2,,N个,

  2. θ是…的解决方案(10)这样的话(f)(θ)=0,=1,2,,N个,

  3. 雅可比矩阵(f):=((f)1,(f)2,,(f)N个)θ,记为(f)(θ),是可逆的。

然后,存在一系列最小化{θM(M)}这样的话
θM(M)=argmin(最小值)θ[1,1]N个=1N个((f)M(M))2(θ)
θM(M)θ作为M(M)+.此外,剩余误差(f)M(M)(θM(M))收敛到0作为M(M)+.
备注3.2

我们设置了N个=K因为极小值的存在依赖于引理中的技术假设3.6第二和第三个假设提供了原始非线性最小二乘问题的良好性(10)。因为我们讨论了完美模型设置下的参数估计问题,第二种假设自然成立。

定理的证明3.1可以在中找到附录A这里,我们将给出一维情况的证明(K=N个=1)来说明主要思想。注意,在一维情况下(11)减少到

(f)M(M)(θ):=k个=0M(M)αk个P(P)k个(θ),
(15)

哪里{P(P)n个}是规范化的勒让德多项式。我们从两个引理开始,这两个引理与(f)M(M)证明见参考文献。24.

引理3.3
(f)C类([1,1]),则相应的最小二乘近似由(15)满足
k个+αk个k个=0

引理3.3连接平滑度(f)和广义傅里叶系数的衰减率αk个.以下引理是引理的直接结果3.3.

引理3.4
(f)C类2([1,1])(f)M(M)是以下公式给出的相应最小二乘近似值(15),那么对于任何ϵ>0,存在N个>0这样的话M(M)>N个我们有
(f)(f)M(M)ϵM(M).
因此,我们有(f)M(M)(f)逐点打开[1,1].

在这里,·表示L(左)-规范C类2[1,1].在命题证明中3.7,我们还需要((f)M(M))(f)0作为M(M)+为了获得这种收敛性,需要更高的正则性(f)特别是,我们有

引理3.5

(f)C类4([1,1])(f)M(M)是以下公式给出的相应最小二乘近似值(15).我们有(f)((f)M(M))0作为M(M)+.

证明。
遵循引理证明中的相同思想3.4,24我们将展示这一点{((f)M(M))}是Cauchy序列L(左)-规范。通知>n个,
((f)(f)n个)=k个=n个+1αk个P(P)k个k个=n个+1|αk个|P(P)k个,
这表明我们需要找到一个L(左)绑定到P(P)k个.使用递归关系第页n个+1第页n个1=(2n个+1)第页n个第页n个=1,我们有
P(P)n个=n个+12第页n个12n个(n个+1)n个+12.
(16)
因此,
((f)(f)n个)12k个=n个+1|αk个|k个(k个+1)k个+12.
从引理3.3,我们知道(f)C类4([1,1])足以确保{((f)M(M))}是柯西。((f)M(M))φC类0([1,1])在里面L(左)感觉。剩下的问题是φ=(f).这很简单,因为通过引理3.4我们知道(f)M(M)(f)有针对性地。此外,
(f)M(M)(θ)(f)M(M)(1)=1θ((f)M(M))(t吨)d日t吨,M(M)+1θ((f)M(M))(t吨)d日t吨=1θφ(t吨)d日t吨,θ[1,1],
收敛性相对于x个因此,x个[1,1],
M(M)+(f)M(M)(θ)(f)M(M)(1)=(f)(θ)(f)(1)=1θφ(t吨)d日t吨,
也就是说,(f)=φ.

到目前为止,我们已经证明了(f),我们有两者的一致收敛性(f)M(M)(f)((f)M(M))(f)[1,1].显示附近极小值的存在θ,以下引理至关重要。

引理3.6

如果:R(右)n个R(右)在域中连续可微假设有一个开着的球B类(x个0,第页)和一个积极的γ这样的话如果(x个)1γx个B类(x个0,第页)第页>γ如果(x个0)然后,如果(x个)=0在中有解决方案B类(x个0,第页).

证据见参考文献。25.在一维情况下,引理3.6基本上说,如果C类1功能(f)以最小速度变化(|(f)|>γ1)关于区间(x个0第页,x个0+第页)和函数值x个0足够小了[(f)(x个0)第页γ],则函数必须在此间隔内达到零。带引理3.43.6,我们能够证明以下结果,这是定理的一维类比3.1.

提议3.7
考虑以下一维非线性最小二乘问题:
最小值θ[1,1](f)2(θ),
带解决方案θ.如果(f)近似值为(f)M(M)由提供(15)我们假设
  1. (f)C类4([1,1]),

  2. (f)(θ)=0,

  3. |(f)(θ)|0,

那么存在一个极小值序列{θM(M)}这样的话
((f)M(M))2(θM(M))=最小值θ[1,1]((f)M(M))2(θ)=:e(电子)M(M)2
M(M)+θM(M)=θ,M(M)+|(f)M(M)(θM(M))|=0
证明。
从引理3.43.5,我们知道第一个假设提供了
n个+(f)(f)M(M)=0,n个+(f)((f)M(M))=0
如果M(M)(θ):=(f)M(M)(θ)e(电子)M(M),我们将应用引理3.6如果M(M)θ.自(f)(θ)0通过连续性,我们知道存在正常数γ第页这样的话
|(f)(θ)|1γ2,θ(θ第页,θ+第页)(1,1).
(17)
进一步注意(如果M(M))=((f)M(M))(f)((f)M(M))0。这意味着存在一个正常数L(左)1这样的话M(M)>L(左)1
|(如果M(M))(θ)1|γ,θ(θ第页,θ+第页)(1,1).
(18)
θ=θ,我们有
|如果M(M)(θ)|=|(f)M(M)(θ)e(电子)M(M)||(f)M(M)(θ)|+e(电子)M(M)2|(f)M(M)(θ)|,
我们利用事实e(电子)M(M)|(f)M(M)(θ)|,自e(电子)M(M)2是的最小值((f)M(M))2[1,1]。因此,
M(M)+|如果M(M)(θ)|M(M)+2|(f)M(M)(θ)|=2|(f)(θ)|=0
因此,我们可以选择L(左)2>0这样的话M(M)>L(左)2
|如果M(M)(θ)|<第页γ.
(19)
既然我们都有(18)(19)M(M)>最大值{L(左)1,L(左)2}=:L(左),涂抹Lemma3.6如果M(M)θ,我们得出结论如果M(M)(θ)=0在中有解决方案(θ第页,θ+第页).表示如下解决方案θM(M),这是近似最小二乘问题的极小值,即,
((f)M(M))2(θM(M))=e(电子)M(M)2=最小值θ[1,1]((f)M(M))2(θ),M(M)>L(左).
将中值定理应用于(f)(θM(M))(f)(θ)对于M(M)>L(左),我们有
|θθM(M)||(f)(ξM(M))|1|(f)(θ)(f)(θM(M))|=|(f)(ξM(M))|1|(f)(θM(M))|,
对一些人来说ξM(M)(θ第页,θ+第页)因此(17)导致
|θθM(M)|γ2|(f)(θM(M))|γ2[|(f)(θM(M))(f)M(M)(θM(M))|+|(f)M(M)(θM(M))|]γ2[(f)(f)M(M)+|(f)M(M)(θ)|]γϵM(M)0,
作为M(M)以及任何ϵ>0在这里,我们使用了引理3.4限定第一项和剩余误差
|(f)M(M)(θM(M))||(f)M(M)(θ)|=|(f)M(M)(θ)(f)(θ)|ϵM(M).

这个结果保证了近似多项式最小二乘问题在相当强的条件下收敛于真最小二乘问题的解的极小值的存在,即:,(f)足够平滑。在实践中(参见第。四、),即使基本统计数据不像理论估计所要求的那样规则,我们也会看到相当准确的估计。

在算法1中,我们正在解决一个最小二乘问题(13)对于Gauss-Newton方法,雅可比矩阵满秩假设下的标准局部收敛结果是众所周知的(例如,参见参考文献第2章。26详细信息)。为了在我们的数值算法中实现这种局部收敛,我们现在将验证多项式混沌设置中的满秩条件。

对于我们的问题,雅可比矩阵JM(M)(θ)R(右)K×N个由提供

(JM(M))j个=(f)M(M)θj个,=1,,K,j个=1,N个,

哪里(f)M(M)是有限维多项式空间的元素ΓN个M(M)由定义

ΓN个M(M):=跨度{θ1k个1θ2k个2·θN个k个N个|k个=0,1,,M(M)}.

在函数空间上使用线性独立性ΓN个M(M)以及代数中的一些基本结果,我们可以证明以下定理。

定理3.8
如果如果:={(f)}=1KΓN个M(M)线性独立,且K>最大值{N个,(M(M)+1)N个1},然后是相应雅可比矩阵的列空间J(θ)在中排名满(ΓN个M(M))K.此外,成套设备N个(J)由定义
N个(J):={θR(右)N个|等级[J(θ)]N个1}
没有密集的地方R(右)N个.
证明。

请参见附录B.

备注3.9

在这里,N个(J)是一组θ为此J(θ)不是矩阵意义上的满秩。在我们的应用程序中,N个是参数的尺寸θ,K是中方程式的总数(9)、和M(M)是中使用的近似顺序(11)在实践中,由于正交多项式涉及(11)形成基础ΓN个M(M),检查系数矩阵的秩就足够了A类M(M),其中第个列由系数组成αk个()在里面(11)尽一切可能k个线性独立性假设在实践中确实是明智的,因为我们希望避免解决未确定的最小二乘问题。

对于第一个例子,我们考虑统计力学中的一个经典模型:保守力、阻尼力和随机力驱动的粒子动力学。特别是,我们根据莫尔斯势选择保守力

单位(x个)=单位0[(x个x个0)],单位0(x个)=ϵ(e(电子)2x个2e(电子)x个+0.01x个2),
(20)

其中最后一个二次项单位0起到保持电位(也称为限制电位)的作用,防止粒子移动到无穷远。对于这个一维模型,我们将质量重新调整为单位=1并将动力学编写如下:

{x个˙=v(v),v(v)˙=单位(x个)γv(v)+2γk个B类T型W公司˙,
(21)

哪里W公司˙是白噪音。系统的发电机(21),表示为L(左),由给出

L(左)=v(v)x个+[单位(x个)γv(v)]v(v)+γk个B类T型2v(v)2.
(22)

平滑保持潜力单位(x个)保证了朗之万系统的遍历性(21)(请参见附录C详细信息)。也就是说,存在一个平衡分布(吉布斯测度)第页e(电子)q个(x个,v(v)),由提供

第页e(电子)q个经验{1k个B类T型[单位(x个)+12v(v)2]},
(23)

独立于γ特别是,我们有v(v)N个(0,k个B类T型)处于平衡状态。对于这个朗之万模型,共有五个未知参数θ:=(γ,T型,ϵ,,x个0)具有真值θ:=(γ,T型,ϵ,,x个0).

对于这个特定的问题,请注意除γ出现在平衡密度函数中。直觉上,这表明可以估计四个参数,{T型,ϵ,,x个0},来自平衡统计和γ分别来自两点统计。为了便于诊断,我们将根据本指南提出一种传统的估计方法。特别是,参数γ将根据如第。四、A随后,通过一点统计获得其余四个参数,如所示(27)和第。IV B 1类.

对于提议的方法,我们将考虑以最有效的方式使用基本统计数据估计所有参数。首先是两个参数,{γ,T型},将使用(27)然后,通过第。IV乙2,我们将显示该参数x个0独立于基本统计数据。因此,我们提出了一个最小二乘问题来估计θ=(ϵ,)并使用平衡统计来估计x个0.

在我们之前的工作中,5我们建议了一种估算方法T型γ直接来自基本统计数据。为了构造这样的基本统计数据,我们考虑一个恒定的外力δ(f)具有δ1相应的扰动系统由下式给出

{x个˙=v(v),v(v)˙=单位(x个)γv(v)+δ(f)+2γk个B类T型W公司˙,
(24)

也就是说,c(c)(x个)=(0,1)在FDT公式中(3).通过选择可观察到的A类=(0,v(v)),我们与(2,2)由给定的响应运算符的条目

k个A类(t吨;θ)=1k个B类T型E类第页e(电子)q个[v(v)(t吨)v(v)(0)]=1k个B类T型R(右)2R(右)2v(v)v(v)0ρ(x个,v(v),t吨|x个0,v(v)0,0)×第页e(电子)q个(x个0,v(v)0)d日x个d日v(v)d日x个0d日v(v)0,
(25)

哪里ρ是对应的福克-普朗克方程的解(5)与朗之万动力学有关。求时间导数E类第页e(电子)q个[v(v)(t吨)v(v)(0)]对于t吨>0,我们获得

t吨E类第页e(电子)q个[v(v)(t吨)v(v)(0)]=R(右)2R(右)2v(v)v(v)0L(左)ρ(x个,v(v),t吨|x个0,v(v)0,0)第页e(电子)q个(x个0,v(v)0)d日x个d日v(v)d日x个0d日v(v)0=R(右)2R(右)2L(左)v(v)v(v)0ρ(x个,v(v),t吨|x个0,v(v)0,0)第页e(电子)q个(x个0,v(v)0)d日x个d日v(v)d日x个0d日v(v)0=R(右)2R(右)2[单位(x个)γv(v)]v(v)0ρ(x个,v(v),t吨|x个0,v(v)0,0)×第页e(电子)q个(x个0,v(v)0)d日x个d日v(v)d日x个0d日v(v)0=E类第页e(电子)q个({单位[x个(t吨)]γv(v)(t吨)}v(v)(0)).
(26)

t吨0+在里面(26)回忆一下v(v)N个(0,k个B类T型)在平衡状态下,我们有

E类第页e(电子)q个[v(v)(t吨)v(v)(0)]|t吨=0=k个B类T型,t吨E类第页e(电子)q个[v(v)(t吨)v(v)(0)]|t吨=0+=γk个B类T型,
(27)

其中左手边都可以从样本中计算出来。因此,(27)提供以下方面的直接估计T型γ因此,原始参数估计问题可以简化为估计(ϵ,,x个0)在势函数中单位,这是一项非常重要的任务,因为第页e(电子)q个关于这些参数是相当复杂的。根据这些估计,B类变得可用,因为它只依赖于k个B类T型,允许计算M(M)j个(t吨)在里面(8)并避免备注中指出的问题2.4.

在本小节中,我们将重点讨论三维参数估计问题θ:=(ϵ,,x个0)首先,我们回顾了传统方法,该方法与x个然后,我们使用基本统计学讨论了所提出的新方法。特别是,我们进行了敏感性分析,以确定基本统计数据中参数的可识别性。最后,我们给出了数值结果,包括传统方法和新方法之间的比较。

1.常规方法

我们首先看一下从平衡统计中可以学到什么。由于x个处于平衡状态时与经验[单位(x个;θ)/k个B类T型],一个自然的想法是匹配x个关于这个平衡密度。特别是,可以引入以下三个方程:

E类第页e(电子)q个[x个]=E类第页e(电子)q个[x个;ϵ,,x个0],=1,2,,
(28)

其中,左手侧是根据给定数据计算的,而右手侧则被视为(ϵ,,x个0),通过求解模型获得(24)以下预计算简化了公式。(28)变成一维问题。

首先,我们定义了概率密度函数

第页e(电子)q个,x个0(x个):=1N个经验{1k个B类T型单位0[(x个x个0)]},第页e(电子)q个1,0(x个):=1N个0经验[1k个B类T型单位0(x个)],

依据单位单位0分别是。随着变量的变化:=(x个x个0),归一化常数N个N个0满足

N个=R(右)经验{1k个B类T型单位0[(x个x个0)]}d日x个=1R(右)经验[1k个B类T型单位0()]d日=1N个0.

因此(28)可以写入

E类第页e(电子)q个[x个]=E类第页e(电子)q个,x个0[x个]=1E类第页e(电子)q个1,0[x个]+x个0,E类第页e(电子)q个[x个2]=E类第页e(电子)q个,x个0[x个2]=12E类第页e(电子)q个1,0[x个2]+2x个0E类第页e(电子)q个1,0[x个]+x个02,

具有独特的解决方案

=变量第页e(电子)q个1,0[x个]变量第页e(电子)q个[x个],x个0=E类第页e(电子)q个[x个]E类第页e(电子)q个1,0[x个]变量第页e(电子)q个[x个]变量第页e(电子)q个1,0[x个],
(29)

哪里变量第页e(电子)q个1,0[x个]代表的方差x个相对于重标度平衡密度第页e(电子)q个1,0在实践中,两者都是E类第页e(电子)q个[x个]变量第页e(电子)q个[x个]可以直接根据可用数据进行经验估计,而变量第页e(电子)q个1,0[x个]是的函数ϵ只有。因此,(29)可以表示为

=(ϵ);x个0=x个0(ϵ),

(28)被简化为一维问题ϵ,

E类第页e(电子)q个[x个]=E类第页e(电子)q个[x个;ϵ,,x个0][=R(右)x个第页e(电子)q个(x个;ϵ,,x个0)d日x个],科学技术。=(ϵ),x个0=x个0(ϵ).
(30)

请注意(30)将通过未扰动数据的Monte-Carlo平均值进行估计,而右侧积分将使用数值求积进行近似。

2.基本统计的敏感性分析

为了确保成功的参数估计,收集一些先验的从提出的基本统计中了解参数可识别性。这一点很重要,尤其是因为有非唯一的基本统计选择是合适的,我们希望确保我们能够从适当的基本统计中识别参数:回想一下,基本统计是基于外部强迫和可观察的选择来定义的。

而局部敏感性分析,如参考文献。27是可取的,它需要了解我们无法获得的真实参数。本质上,路径导数方法是计算¯θ:=E类[Y(Y)(t吨,ω)],其中Y(Y)(t吨,ω):=θX(X)(t吨,θ)并且期望是相对于Itô扩散的密度来定义的(以积分形式书写)

X(X)(t吨,θ)=X(X)0(θ)+0t吨b条[X(X)(,θ),θ]d日+0t吨σ[X(X)(,θ),θ]d日W公司.
(31)

因为我们没有密度的显式解ρ(x个,t吨;θ),一种近似方法¯θ使用以下方程解的集合平均值:

Y(Y)(t吨,θ)=Y(Y)0(θ)+0t吨{b条X(X)[X(X)(,θ),θ]Y(Y)(,θ)+b条θ[X(X)(,θ),θ]}d日+0t吨{σX(X)[X(X)(,θ),θ]Y(Y)(,θ)+σθ[X(X)(,θ),θ]}d日W公司.
(32)

注意,这个方程取决于(31)和未知参数,θ.对θ意味着不能将此方法用于先验的敏感性分析。然而,它可以用于后部敏感性分析,在估算时进行评估,以验证特定参数状态的困难。

作为一种经验方法先验的敏感性分析,我们只需检查k个^(t吨,θ)作为训练搭配节点的函数,θΘ,可从算法1的步骤2中获得。当然,还有一种更精细的全球敏感性分析技术,如Sobol指数28也可以表演,但我们不会在这里继续。根据这个经验先验的敏感性分析,我们发现相应的基本统计,E类第页e(电子)q个[v(v)(t吨)v(v)(0)]对…不敏感x个0然而,它对并且对ϵ此外,低阻尼情况的灵敏度(γ=0.5)比高阻尼外壳更强(γ=0). 为了验证该经验方法的有效性,我们计算了局部敏感性分析指数¯θ:=E类[Y(Y)(t吨,ω)],其中Y(Y)(t吨,ω)解决(32)使用真实参数(同样,这在实践中是不可行的,因为真实参数不可用)。

对于我们的朗之万模型,我们有相应的漂移系数和扩散系数

b条=[v(v),单位(x个)γv(v)],σ=(0,2γk个B类T型).

假设我们对参数的依赖性感兴趣x个0.介绍符号x个x个0:=x个0x个(t吨,x个0)v(v)x个0:=x个0v(v)(t吨,x个0),联合系统(31)(32)(以微分形式书写)如下所示:

{x个˙=v(v),v(v)˙=单位(x个;x个0)γv(v)+2γk个B类T型W公司˙,x个˙x个0=v(v)x个0,v(v)˙x个0=单位(x个;x个0)x个x个0γv(v)x个0x个0单位(x个;x个0).
(33)

最后一个方程中没有随机项,因为朗之万模型中的噪声是可加性的,系数独立于x个0。请注意(x个x个0,v(v)x个0)(1,0)是中最后两个方程的不动点(33)因为

x个0单位(x个;x个0)=x个0单位0[(x个x个0)]=2单位0[(x个x个0)]=x个单位(x个;x个0).

因此,通过选择初始条件[x个(0),v(v)(0)]=(x个0,c(c))对于任意常数c(c),可以声称解决方案v(v)(t吨)朗之万模型(21)独立于x个0因此,在这种情况下,E类第页e(电子)q个[v(v)(t吨)v(v)(0)]独立于x个0,证实了我们的实证结论先验的敏感性分析。

虽然这种参数不敏感似乎令人沮丧,但我们可以利用它来简化问题。也就是说,我们可以为x个0在应用算法1时,只考虑估计θ=(,ϵ)。一旦估计了这两个参数,我们可以在(29)估计x个0.

我们还使用这种局部敏感性分析来验证先验的关于以下方面的敏感性分析ϵ由于难以如上所述分析显式行为,对于给定的Langevin模型实现,我们使用四阶Runge-Kutta方法求解剩余的ODE。图2显示了的数值结果v(v)¯v(v)¯ϵ其中,平均值估计超过3000个朗之万模型变现。根据v(v)¯v(v)¯ϵ在里面图2,我们确认了两点统计灵敏度的有效性E类第页e(电子)q个[v(v)(t吨)v(v)(0)]这是经验性的发现。也就是说ϵ以及低阻尼情况的可识别性(γ=0.5)比高阻尼外壳更强(γ=5).

图2。

的绝对值v(v)¯v(v)¯ϵ对于两者γ=0.5γ=5.

图2。

的绝对值v(v)¯v(v)¯ϵ对于两者γ=0.5γ=5.

关闭模态

我们现在给出几个数值结果。基于大小的时间序列107(具有时间滞后小时=2×10),我们比较了传统方法和符合以下基本统计的建议方案γ=0.55,分别表示低阻尼情况和高阻尼情况。其余四个参数的真值设置为(k个B类T型,ϵ,,x个0)=(1,0.2,10,0)数据以时间序列的形式从模型中生成(24)使用算子分裂方法,29这是一个强大的二阶方法。

1.低阻尼箱

我们从传统方法开始。检查评估的敏感性(ϵ,,x个0)估算值T型^作为比较,我们还包括使用真实值的估算k个B类T型=1在解决中(30)(我们将此场景的结果称为部分估计)。结果已在中列出表一我们清楚地观察到,传统方法的结果对T型^。要解释敏感性,请回忆在解决问题时(30),x个0被视为的功能ϵ这表明,如果

ϵk个B类T型=(E类第页e(电子)q个[x个;T型,ϵ,(ϵ),x个0(ϵ)]ϵ)1·E类第页e(电子)q个[x个;T型,ϵ,(ϵ),x个0(ϵ)]k个B类T型1,

哪里(ϵ)x个0(ϵ)由提供(29)并应用了隐函数定理。通过直接计算,我们得到

k个B类T型E类第页e(电子)q个[x个n个]=1(k个B类T型)2{E类第页e(电子)q个[x个n个单位(x个)]E类第页e(电子)q个[x个n个]E类第页e(电子)q个[单位(x个)]},n个=1,2,.

由于关于的偏导数的显式公式ϵ不容易计算,其值将使用有限差分公式计算。评估时间:(k个B类T型,ϵ,,x个0)=(1,0.2,10,0),我们有

k个B类T型E类第页e(电子)q个[x个;T型,ϵ,(ϵ),x个0(ϵ)]=9.034,ϵE类第页e(电子)q个[x个;T型,ϵ,(ϵ),x个0(ϵ)]=0.06396,

这支持了我们的观察。

表一。

使用平衡统计(上文)和使用基本统计(下文)的传统方法的全部和部分估计:低阻尼情况。

k个B类T型γϵx个0
真的1.0000 0.50000 0.20000 10.000 0.0000 
等式统计完整估计0.99903 0.50003 0.16870 10.888 0.001120 
等式统计部分估计 0.50003 0.20039 2005年10月0.011263 
基本统计估计0.99903 0.50003 0.20004 9.9741 0.008265 
k个B类T型γϵx个0
真的1.0000 0.50000 0.20000 10.000 0.0000 
等式统计完整估计0.99903 0.50003 0.16870 10.888 0.001120 
等式统计部分估计 0.50003 0.20039 10.005 0.011263 
基本统计估计0.99903 0.50003 0.20004 9.9741美元0.008265 

接下来,我们报告了使用基本统计数据从新方法中获得的估计值,结果如下所示表一.精确度的提高ϵ与传统方法的完全估计相比,这一点值得注意。在这里,我们总共使用了20基本统计数据由k个A类(t吨;θ)对于t吨=0.1,=1,2,,20。我们应用算法1求解二维集合(x个0)基于的非线性最小二乘问题300均匀生成的随机初始条件。图3(左)显示了成本函数的等高线图以及所有估算。请注意,除了少数异常值外,大多数估计值都位于成本函数轮廓的低值上。估计值ϵ^reported是所有估计值的平均值(不包括异常值)。为了满足平衡约束,(ϵ^)由提供(29)用于估算.

图3。

成本函数的等高线图以及估计值:低阻尼情况(左)和高阻尼情况(右)。

图3。

成本函数的等高线图以及估计值:低阻尼情况(左)和高阻尼情况(右)。

关闭模态

该测试的结果表明,对于传统方法,很难获得对ϵ,除非T型可以准确估计,例如使用更长的时间序列。相比之下,使用基本统计的拟议方法对T型^然而,这种方法需要如算法1中所述的预计算步骤。在我们的数值测试中,我们求解了模型(21)在64个搭配节点上评估不同值的基本统计量(ϵ,),也就是说,订单M(M)C类=8Chebyshev节点用于构造Θ在中使用(12)然而,正如我们之前提到的,这可以并行完成,并且只要参数的维数相对较小,它就不会成为一个严重的问题。至于M(M)在里面(12),我们选择了M(M)=6(同样的方案也适用于高阻尼情况。)

当阻尼参数较大时,会出现另一个有趣的问题。由于传统方法完全依赖于平衡密度的单点统计,因此重要的是要有高质量的独立样本。图4(左),我们显示了x个对于两种低阻尼状态(γ=0.5)和高阻尼状态(γ=5). 我们观察到,在后一种情况下x个衰减速度慢得多,表明样本之间具有很强的相关性,且滞后较小。在这种情况下,由于难以获得高质量的独立抽样,传统方法的估计值将恶化。

图4。

时间自相关x个(左)和v(v)(右)。

图4。

时间自相关x个(左)和v(v)(右)。

关闭模态

2.高阻尼情况

在本节中,我们将重点介绍高阻尼状态γ=5。我们还将在图2以及使用基本统计数据的估计。如所示图4(左),我们不再有时间自相关的快速衰减x个因此,在不改变样本量的情况下,估计x个用于传统方法。从中列出的结果可以清楚地看到这一点表二特别是,除了对T型^、估算误差E类第页e(电子)q个[x个n个]对于n个=1,2,也会导致不准确的估计ϵ,、和x个0我们应该指出一个有趣的事实,即尽管x个处于平衡状态时与γ,值很大γ导致难以估计x个在实践中。

表二。

使用平衡统计(上文)和使用基本统计(下文)的传统方法的全部和部分估计:高阻尼情况。

k个B类T型γϵx个0
真的1.0000 5.0000 0.20000 10.000 0.0000 
等式统计完整估计0.99949 4.9993 0.69579 5.4717 0.12990 
等式统计部分估计 4.9993 0.25931 8.9295 −0.0034460 
基本统计估计0.999494.9993 0.21160 9.8663美元−0.01822 
k个B类T型γϵx个0
真的1.0000 5.0000 0.20000 10.000 0.0000 
等式统计完整估计0.99949 4.9993 0.69579 5.4717 0.12990 
等式统计部分估计 4.9993 0.25931 8.9295 −0.0034460 
基本统计估计0.99949 4.9993 0.21160 9.8663 −0.01822 

表二图3(右)使用基本统计显示数值结果。虽然相对误差没有低阻尼情况下的小,但仍低于传统方法的估计值。我们的方法是这样实现的:与低阻尼情况类似,(29)用于估算基于估计ϵ^这里的20个基本统计数据如下所示k个A类(t吨;θ)对于t吨=0.04+0.2,=1,2,,20[由时间自相关v(v)如所示图4(右)],时间间隔更短。与低阻尼情况相比,可以通过灵敏度分析验证精度损失(图2),这表明参数(,x个0)在这种制度下,当γ很大。

我们的下一个例子是由白噪声驱动的梯度系统。我们考虑一个二维随机系统,如下所示:

d日x个(t吨)=C类V(V)(x个)d日t吨+2k个B类T型d日W公司t吨,
(34)

哪里W公司t吨是一个二维维纳过程,V(V)是势能,并且C类是由定义的矩阵

C类=(1d日d日1),d日(1,1).

发电机L(左)系统的(34)由提供

L(左)(f)=(V(V)x个1d日V(V)x个2)(f)x个1(d日V(V)x个1+V(V)x个2)(f)x个2+k个B类T型Δ(f).
(35)

我们选择三重势函数V(V)与参考文献中的模型类似。30,

V(V)(x个1,x个2)=v(v)(x个12+x个22)(1γ)v(v)[(x个12)2+x个22](1+γ)v(v)[(x个1)2+(x个2)2]+0.2[(x个1)2+(x个2/)2],
(36)

具有

v(v)(z(z))=10经验(1z(z)22)·χ(,)(z(z)),z(z)R(右),

哪里χ(,)(z(z))表示区间内的特征函数(,)注意,矩阵C类是正定的。附加二次项0.2[(x个1)2+(x个2/)2]在三重势中(36)这也是一个平稳的保持潜力。这是众所周知的1三向模型(34)产生一个平衡分布,由

第页e(电子)q个(x个)经验(V(V)(x个)k个B类T型)x个R(右)2,
(37)

与参数无关d日,非对角元素C类.

在数值测试中,我们设置(d日,,k个B类T型,γ)=(0.5,1,1.5,0.25)作为参数的真实值。图5显示了在这组参数下势的等值线图和时间序列的散点图。要从中生成数据(34),我们应用了参考文献中介绍的弱梯形方法。31,这是一种弱二阶方法。在本节的其余部分中,我们将从中选择适当的基本统计数据{d日,T型}可以直接估计剩余参数,{,γ},将使用适当的最小二乘问题进行估计。

图5:。

势的等高线图(左)和具有10采样点(右侧)。

图5:。

电位的等高线图(左)和溶液的散点图10采样点(右侧)。

关闭模态

与Langevin模型类似,我们考虑了在x个随后,扰动动力学由下式给出

d日x个(t吨)=[C类V(V)(x个)+(f)(t吨)δ]d日t吨+2k个B类T型d日W公司t吨,
(38)

哪里|δ|1。如果我们选择A类(x个):=x个作为可观测值,相应的线性响应操作符读取

k个A类(t吨;θ)=E类第页e(电子)q个{A类[x个(t吨)]B类[x个(0)]},

哪里B类=(B类1,B类2)具有

B类(x个1,x个2)=1k个B类T型x个V(V)(x个1,x个2),=1,2,

由提供(3)因此,线性响应运算符的条目k个A类(t吨;θ)满足

k个(,j个)(t吨;θ):=1k个B类T型E类第页e(电子)q个{x个(t吨)V(V)x个j个[x个1(0),x个2(0)]},,j个=1,2,
(39)

哪里V(V)x个表示的偏导数V(V)关于x个使用按部件集成,可以显示

R(右)x个V(V)x个(x个1,x个2)经验[V(V)(x个1,x个2)/k个B类T型]d日x个j个=δj个k个B类T型R(右)经验[V(V)(x个1,x个2)/k个B类T型]d日x个j个,,j个=1,2,

这将导致

k个,j个(0;θ)=δj个.
(40)

这就是统计力学中的能量均分。

注意,响应操作符k个(,j个)(t吨;θ)由于函数V(V)x个(x个,θ)取决于未知的真参数值(k个B类T型,,γ)这正是备注中提出的问题之一2.4对于梯度流系统,可以通过对另一组两点统计数据引入线性变换来克服此问题。我们定义

,j个(t吨;θ):=E类第页e(电子)q个[x个(t吨)x个j个(0)],,j个=1,2
(41)

并考虑它们的时间导数。根据同样的计算(26),我们获得以下身份t吨>0:

d日d日t吨,j个(t吨;θ)=k个B类T型[k个j个,(t吨;θ)+(1)1d日·k个j个,(t吨;θ)],,j个=1,2
(42)

重写更有帮助(42)成为一个线性系统t吨>0,

k个B类T型(1d日00001d日d日10000d日1)(k个1,1(t吨)k个1,2(t吨)k个2,1(t吨)k个2,2(t吨))=(1,1(t吨)1,2(t吨)2,1(t吨)2,2(t吨)),
(43)

其中系数矩阵是非奇异的,因为d日(1,1)这种线性关系表明可以考虑拟合,j个代替k个,j个,因为前者在数字上是可访问的。

t吨0+并应用(40)到的第一个和第三个方程(43)在下面θ=θ,我们得到以下估计d日T型:

k个B类T型=1,1(0+;θ);d日=2,1(0+;θ)/k个B类T型,
(44)

哪里,j个(0+;θ)可根据可用样本计算。方程式(44)将问题简化为二维估算问题(,γ)只有。

如前所述,线性响应算子,k个(,j个)(t吨;θ)(39),无法直接访问。受线性关系的激励(43),我们考虑推断这些值(,γ)从两点统计,j个(t吨;θ)(41)。特别是,我们选择1,1(t吨;θ)具有t吨=0.1,=1,,20作为我们数值测试中的基本统计数据。

鉴于以下事实1,1(t吨;θ)是的两点统计x个1,我们可以应用经验先验的通过检查k个^(t吨,θ)在训练搭配节点上θ=(,γ)Θ,可从算法1的步骤2中获得。在这个数值实验中,训练使用了25个搭配节点,θΘ为了验证此经验敏感性测试,我们还进行了第。IV B 2类到参数γ(这在实践中也是不可能的,因为真实参数未知)。结果如所示图6(左)。从规模来看x个¯x个¯γ(平均值超过2000实现x个),我们可以看到这个两点统计,1,1(t吨;θ),对参数非常敏感γ,对参数的依赖性更强.

图6。

局部敏感性试验x个1关于参数γ(左)和成本函数的等高线图以及估计值(右)。

图6。

局部敏感性试验x个1关于参数γ(左)和成本函数的等高线图以及估计值(右)。

关闭模态

基于大小的时间序列4×106(有时滞小时=1×10),我们用实现了算法1M(M)=4和搭配节点,Θ,根据订单构造M(M)C类=5中的Chebyshev节点(12).

估计值如所示表III。我们还展示了图6(右)成本函数的等值线图以及基于300均匀生成的初始猜测。请注意,真正的参数值不在最低轮廓值上,这些差异是由于替代建模和样本质量造成的。然而,估计^γ^仍然相当准确,如表III我们应该指出^γ^此表中报告的是所有估计值的平均值(不包括异常值),而估计值k个B类T型^d日^通过求解获得(44)等高线图也证实了敏感性分析,这表明估计γ.

表III。

估计结果:三井模型。

γk个B类T型d日
真的1.0000 0.2500 1.5000 0.5000 
估算1.0249 0.2463 1.4946 0.5077 
γk个B类T型d日
真的1.0000 0.2500 1.5000 0.5000 
估算1.0249 0.2463 1.4946 0.5077 

一个有趣的问题是,参数的近似值能否再现基本统计数据,这对于预测存在外力的非平衡平均值很有用。使用中报告的估计表III,我们比较了用于估计参数的两点统计结果,1,1(t吨;θ^),具有相应的真实统计信息,1,1(t吨;θ)(请参见图7,左)。图7(右),我们还比较了估计的响应操作符,k个1,1(t吨,θ^)和真正的响应运算符,k个1,1(t吨,θ)。一致性很好。

图7。

响应统计信息的恢复E类第页e(电子)q个[x个1(t吨)x个1(0)](左)和两点统计E类第页e(电子)q个{x个1(t吨)V(V)x个1[x个1(0),x个2(0)]}(右)。所有轨迹都已标准化,因此它们都是从某一点开始的(0,1).

图7。

恢复响应统计信息E类第页e(电子)q个[x个1(t吨)x个1(0)](左)和两点统计E类第页e(电子)q个{x个1(t吨)V(V)x个1[x个1(0),x个2(0)]}(右)。所有轨迹都已标准化,因此它们都是从某一点开始的(0,1).

关闭模态

本文提出了一种以漂移扩散为形式的随机模型参数估计方法。为了推断平衡密度函数中没有出现的参数,我们建议拟合两点基本统计数据使用涨落耗散理论制定。在我们先前工作中建立的框架的基础上,5当无法通过求解相应的统计约束直接估计参数时,我们将该问题表示为一个受动态约束的非线性最小二乘问题。为了避免在使用Gauss-Newton方法时在每次迭代中评估基本统计量时花费昂贵的计算成本,我们提出了基于多项式代理建模方法的近似最小二乘问题。这种方法的动机是,在计算基本统计值时,抽样误差是不可避免的,而基本统计是参数的平滑函数。我们保证了近似最小二乘问题的极小值的存在性,该问题收敛于涉及本质统计的真最小二乘问题的解,假设这些统计是参数的光滑函数。我们还证明了多项式近似最小二乘问题具有几乎处处满秩的雅可比矩阵,这意味着高斯-纽顿解的局部收敛性。我们在属于两大类随机模型的两个示例上测试了所提方法——朗之万动力学模型和随机梯度系统。一般来说,我们预计参数估计程序应按以下方式进行:

  1. 只要可能,就使用易于计算的适当统计数据,通过直接估计来减少参数空间。

  2. 根据感兴趣的观测值、平衡密度的函数形式、外部强迫项和可用数据,使用先验的敏感性分析测试。在我们的实现中,我们比较了根据训练参数值(例如搭配节点)计算的基本统计信息。更精细的全局敏感性分析技术,如Sobol指数28可用于确定参数的可识别性。

  3. 对于剩余的参数,在一些训练参数值上使用适当的基本统计量来构造非线性最小二乘问题。

  4. 应用算法1获得估计值θ^真实参数值的θ.

  5. 应用敏感性分析,如第。IV B 2类,作为后部估计值的置信度检查。如果发现参数对所选响应统计信息不敏感,请返回步骤3并选择一组不同的响应统计信息。

我们公式的限制之一是能够计算B类在里面(7)可能需要了解(某些)真实值θ一般来说,这是不可行的。因此,非线性系统(8)在不知道真实参数的情况下无法进行计算。对于朗之万动力学,我们发现k个B类T型在里面B类可以用平衡统计估计,方差v(v)对于梯度流问题,在不可计算的线性响应统计量和不知道真实参数值即可估计的其他两点统计量之间存在可逆线性变换。由于数值算法1不依赖于FDT公式,因此可以将其应用于任何可用的两点统计,例如解的时间自相关。我们不知道有什么常规可以绕过这一困难。然而,正如我们已经证明的那样,至少对于一般的朗之万动力学模型和随机梯度系统来说,这种想法是可行的。

虽然所提出的方法需要了解未扰动系统的平衡密度函数,但可以放宽这一条件,并根据数据进行估计。对于低维问题,可以使用非参数核密度估计方法。32,33如果动力系统的不变分布可以用定义在光滑流形(嵌入到高维相空间中)上的密度函数来表征,数据位于或接近该流形,那么可以应用分布的核嵌入理论来估计密度函数34在Hilbert空间上,基函数定义在数据流形上。类似于参考文献中提出的条件密度估计。3738这些数据驱动的基函数可以通过扩散映射算法获得。35,36非参数方法的另一种替代方法是考虑使用矩约束最大熵原理的参数密度函数估计。39对于中等维密度,比如五到七维密度,可以使用最近开发的等式-By方程(EBE)方法40用于求解矩约束的最大熵问题。EBE方案的源代码可在参考。41.

我们的最终目标之一是将此方法用于分子建模的参数估计,其中通常使用Langevin类型的模型。势能通常涉及一大组参数,例如与键拉伸和键角变形相关的刚度常数,以及范德华系数和屏蔽静电相互作用。阻尼系数的选择也很重要;见审查文件42用于各种角度。与现有方法相比,我们方法的新颖之处在于,我们使用响应统计量来描述参数估计问题,该问题可以揭示平衡密度中未出现的参数。此外,多项式代理模型为解决非线性最小二乘问题提供了一种有效的方法。

然而,为了实现这一目标,仍然存在一些挑战。对于大参数空间,我们怀疑需要结合现有方法来计算与平衡密度相关的参数,作为减少问题的一种方法(如上文第1步所建议的),并使用建议的方法来估计其余参数。其次,所提出的方法需要高质量并且可能需要大量的样本来准确评估基本统计数据。然而,由于基本统计取决于可观测力和外力的选择,只要这两个函数的范围维数很小,就可以避免近似高维积分。最后,底层模型可能会出现建模错误。例如,该模型可以从多尺度扩展中导出,也可以仅仅是经验假设。将在单独的工作中研究存在建模误差时的响应统计公式。

这项研究得到了国家科学基金会(NSF)(批准号:DMS-1619661)的部分支持。X.L.也得到了美国国家科学基金会的支持(批准号DMS-1522617)。J.H.还得到了海军研究办公室(ONR)的支持(批准号N00014-16-1-2888)。

以秒为单位。III B类,我们给出了收敛结果定理3.1并包括一维情况的证明。在这里,我们为将军展示了证据N个-维度案例。我们首先推广引理3.33.5N个-维度案例。

引理A.1
(f)C类([1,1]N个).对应的最小二乘近似系数αk个,我们有
λ+αk个+λe(电子)(k个+λ)=0,
哪里k个表示第个的组件k个e(电子)第个单位向量。
证明。
应用引理3.3,我们引入单变量函数
(θ):=[1,1]N个1(f)(θ)P(P)k个(θ)P(P)k个(θ)d日μ(θ1)·d日μ(θ1)d日μ(θ+1)·d日μ(θN个).
很容易检查(θ)C类([1,1])
11(θ)P(P)k个+λ(θ)d日μ(θ)=αk个+λe(电子)j个.
我们考虑的是(θ)并应用引理3.3对应系数。我们能够得出结论。
引理A.2

(f)C类([1,1]N个)具有>2N个并考虑其最小二乘近似(f)M(M)由提供(11).那么,我们有(f)(f)M(M)0作为M(M)+.

证明。
从引理的证明3.4,这足以表明{(f)M(M)}是关于的Cauchy序列L(左)-规范。对于>n个,我们有
(f)(f)n个λ=n个+1{k个;k个=λ}|αk个|P(P)k个λ=n个+1(λ+12)N个2{k个;k个=λ}|αk个|,
我们利用事实k个=λ,
P(P)k个=π=1N个P(P)k个=π=1N个P(P)k个π=1N个k个+12(λ+12)N个2.
我们进一步注意到多索引集{k个;k个=λ}共有个(λ+1)N个λN个=O(运行)(λN个1)元素,和引理A.1款,我们知道
|αk个|=o个(λ),λ=k个,
对于λ足够大。因此,对于足够大的>n个,我们有
(f)(f)n个C类λ=n个+1(λ+12)N个2λN个1λ,
哪里C类是一个只依赖于N个。最后,使用>2N个,我们知道{(f)M(M)}确实是一个柯西序列L(左)-normal,它完成了证明。

推广引理3.5,考虑偏导数的情况就足够了,也就是说,找到了(f)x个M(M)(f)x个0作为n个+.

引理A.3
对于(f)C类([1,1]N个)具有>2N个+2,我们考虑它的最小二乘近似(f)M(M),由给出(11).那么,我们有
M(M)+x个((f)M(M)(f))=0,=1,2,,N个.
证明。
类似于引理的证明A.2款,我们首先展示{(f)x个M(M)}是一个柯西序列。对于>n个,我们有
(f)x个(f)x个n个λ=n个+1{k个;k个=λ}|αk个|x个P(P)k个λ=n个+112λ(λ+1)(λ+12)N个2{k个;k个=λ}|αk个|,
我们在哪里使用了不等式(16).通过引理A.1款,类似于引理的证明A.2款,我们知道(f)C类([1,1])提供
(f)x个(f)x个n个C类λ=n个+112λ(λ+1)(λ+12)N个2λN个1λ,
哪里C类是一个只依赖于N个。最后,使用>2N个+2,我们可以得出结论{(f)x个M(M)}是关于的Cauchy序列L(左)-规范。用同样的技巧证明引理3.5,我们可以证明(f)x个M(M)确实收敛到(f)x个一致开启[1,1].

现在,我们准备证明定理3.1.

证明。
首先,通过引理A.2款答3,正则性假设只提供了
M(M)+(f)M(M)(f)=0,M(M)+(f)M(M)(f)=0
构造类似函数如果M(M)用于命题证明3.7,我们介绍了符号
最小值θ[1,1]N个=1N个((f)M(M))2(θ)=:=1N个(e(电子)M(M))2,e(电子)M(M):=(e(电子)1M(M),e(电子)2M(M),,e(电子)N个M(M))
并定义如果M(M):=(f)M(M)e(电子)M(M)首先,我们证明了一系列解的存在性,{θM(M)},接近θ通过检验引理的假设3.6如果M(M)θ.自(f)(θ)对于某些人来说,通过连续性是可逆的第页>0足够小,存在正常数γ这样的话
Ş(f)(θ)1γ2,θB类(θ,第页).
稍后,我们将指定第页为了收敛θM(M)θ作为M(M).
我们进一步注意到如果M(M)=(f)M(M)(f)M(M)收敛到(f)均匀地。这意味着存在L(左)1这样的话M(M)>L(左)1
如果M(M)(θ)1γ,θB类(θ,第页).
(A1)
根据的定义e(电子)M(M),我们知道θ=θ
如果M(M)(θ)=(f)M(M)(θ)e(电子)M(M)2(f)M(M)(θ),
这将导致
M(M)+如果M(M)(θ)M(M)+2(f)M(M)(θ)=2(f)(θ)=0
因此,存在L(左)2这样的话M(M)>L(左)2
如果M(M)(θ)<第页γ.
(A2)
M(M)>最大值{L(左)1,L(左)2}=:L(左)、和组合条件(A1)(A2),通过引理3.6如果M(M)θ,我们得出结论如果M(M)(θ)=0在中有解决方案B类(θ,第页)。我们将这种解决方案表示为θM(M)M(M)>L(左),这是近似最小二乘问题的极小值(13).
我们的下一个任务是证明θM(M)收敛到θ注意,在多维情况下,我们没有中值定理。作为补救措施,我们引入以下矩阵值函数:
J(θ;θ):=01(f)[θ+t吨(θθ)]d日t吨.
根据定义,我们知道J(θ;θ)=(f)(θ),它是可逆的
(f)(θ)(f)(θ)=01(f)[θ+t吨(θθ)](θθ)d日t吨=J(θ;θ)(θθ).
(A3)
J(θ;θ)1存在于θ=θ它是θ接近θ,我们可以选择第页>0[相同第页在里面(A1)(A2)]这样的话J(θ;θ)1存在并且
J(θ;θ)1<Δ,θO(运行)(θ,第页),
对于某个正常数Δ.让θ=θM(M)在里面(A3),我们获得
θM(M)θJ(θM(M);θ)1(f)(θM(M))(f)(θ)<Δ(f)(θM(M))Δ[(f)(θM(M))(f)M(M)(θM(M))+(f)M(M)(θM(M))]Δ((f)(f)M(M)+(f)M(M)(θ)).
因此,
M(M)+θM(M)θM(M)+Δ[(f)(f)M(M)+(f)M(M)(θ)]=0
至于残余误差(f)M(M)(θM(M)),我们知道
M(M)+(f)M(M)(θM(M))M(M)+(f)M(M)(θ)=0
证明到此结束。

类牛顿法的局部收敛定理通常需要雅可比矩阵的满秩条件。我们将在有限维函数空间中讨论这个问题ΓN个M(M)由定义

ΓN个M(M):=跨度{θ1k个1θ2k个2·θN个k个N个|k个=0,1,,M(M)}.

由于零元素ΓN个M(M)是恒等零的函数,我们可以引入以下线性独立性的定义。

定义B.1
{(f)1,,(f)n个}ΓN个M(M)称为线性无关集,如果
=1n个c(c)(f)0c(c)=0,=1,,n个.

我们定义微分算子θ:ΓN个M(M)ΓN个M(M),具体如下:

θ(f):=θ(f),=1,N个.

现在,让我们推导出这样一个算子的一些相关性质。

引理B.2

操作员{θ}=1N个满足

  1. 等级(θ)=M(M)(M(M)+1)N个1;

  2. j个,存在排列P(P)j个令人满意的θj个=P(P)j个θP(P)j个.

证明。
我们首先证明等级(θ1)=M(M)(M(M)+1)N个1。这足以表明θ1(M(M)+1)N个1也就是说,昏暗的[克尔(θ1)]=(M(M)+1)N个1。借助多指标,我们可以看到{θk个|k个M(M)}ΓN个M(M)、和
θ1(θk个)0́k个1=0,
产生昏暗的[克尔(θ1)]=(M(M)+1)N个1。我们进一步注意到,任何2个周期(,j个)在对称群中S公司N个诱导排列P(P)j个在基础上
P(P)j个:·θk个·θj个k个j个··θj个k个j个·θk个·.
这种排列导致同一性θj个=P(P)j个θP(P)j个,这意味着等级(θ)=等级(θ1)=M(M)(M(M)+1)N个1对于=1,,N个.

下面的引理也将有助于证明我们的主要结果。

引理B.3
=1N个λθ是以下各项的非平凡线性组合{θ}=1N个,然后
等级(=1N个λθ)M(M)(M(M)+1)N个1.
证明。
Λ==1N个λθ是以下各项的非平凡线性组合{θ}=1N个即。,λj个0.自Λ也是上的线性运算符ΓN个M(M),我们有
等级(Λ)=昏暗的[克尔(Λ)]=(M(M)+1)N个昏暗的(Λ)=(M(M)+1)N个昏暗的[克尔(Λ)].
我们注意到θk个可以分解为
Λ(θk个)=λj个θj个(θ1k个1·θj个k个j个·θN个k个N个)+j个λθ(θ1k个1·θj个k个j个·θN个k个N个)=λj个k个j个θ1k个1·θj个k个j个1·θN个k个N个+θj个k个j个R(右)(θ1,,θj个1,θj个+1,,θN个),
哪里R(右):=j个λθ(θ1k个1·θj个1k个j个1θj个+1k个j个+1·θN个k个N个)是独立于θj个。很容易看出,如果k个j个0,图像不能为同零。这意味着克尔(Λ)跨度{θk个,k个j个=0}; 因此,等级(Λ)M(M)(M(M)+1)N个1.

为了获得直觉,可以考虑以下示例N个=2。可以选择以下订购基础Γ2M(M)

B类:={1,θ2,θ22,,θ2M(M),θ1,θ1θ2,,;θ1θ2M(M),θ12,,θ1M(M)θ2M(M)}.

我们可以推导出θ1θ2

θ1=(002M(M)0),θ2=(E类E类E类),

哪里R(右)M(M)+1×M(M)+1是单位矩阵E类R(右)M(M)+1×M(M)+1定义如下:

E类:=(0102M(M)0).

线性组合θ1+λθ2满足

θ1+λθ2=(λE类λE类2M(M)λE类)

和等级(θ1+λθ2)M(M)(M(M)+1)对于λR(右).

现在我们来讨论雅可比矩阵的满秩条件,

J(θ):=((f)θj个)=1,,K,j个=1,,N个,
(B1)

哪里(f)ΓN个M(M)KN个.让(f)是列向量[(f)1(θ),,(f)K(θ)],然后(f)(ΓN个M(M))K,这是K-时间乘积空间ΓN个M(M)。我们可以用以下方式重写雅可比矩阵:

J(θ)=(θ1(f),,θN个(f)),

哪里θ(f)由操作定义θ在每个组件上(f)根据上述观察,我们准备证明定理3.8.

定理证明3.8。
根据定义,我们知道J(θ)由生成
{θ1(f),,θN个(f)}(ΓN个M(M))K.
考虑这些向量的非平凡线性组合,表示为=1N个c(c)θ(f),那么我们有
=1N个c(c)θ(f)0́(=1N个c(c)θ)(f)0́{(f)}=1K克尔(=1N个c(c)θ).
按引理B.3节,我们知道克尔(=1N个c(c)θ)小于或等于(M(M)+1)N个1,同时昏暗的[跨度(如果)]>(M(M)+1)N个1。因此J(θ)在中具有完全排名(ΓN个M(M))K此外,这意味着第页(θ):=det(探测)[J(θ)J(θ)]不是一个零多项式。N个(J)对应于的根第页(θ)根据代数的标准结果,我们知道N个(J)是的有限集N个=1和一个无处密集的集合N个2.

随着变量的变化[q个=(x个x个0),第页=v(v)],我们减少(21)进入之内

{q个˙=第页,第页˙=单位0(q个)γ第页+2γk个B类T型W公司˙,单位0(q个)=ϵ(e(电子)2q个2e(电子)q个+0.01q个2).
(C1)

验证的遍历性(C1),我们应用参考文献中的定理3.2。15,这需要潜力单位0满足以下两个条件:

  1. 单位0(q个)0为所有人q个R(右).

  2. 存在一个α>0β(0,1)这样的话
    12单位0(q个)q个β单位0(q个)+γ2β(2β)8(1β)q个2α.
    (C2)

对于第一个条件,我们只是注意到在单位0不影响动态或平衡分布。更换单位0在里面(C1)通过

单位0(q个)=ϵ(e(电子)2q个2e(电子)q个+0.01q个2+1),
(C3)

我们有

ϵ(e(电子)2q个2e(电子)q个+0.01q个2+1)=ϵ[(e(电子)q个1)2+0.01q个2]0

对于第二个条件,替换为单位0在里面(C2)通过(C3),不平等变成q个R(右)

q个e(电子)2q个+q个e(电子)q个βe(电子)2q个+2βe(电子)q个+[0.01(1β)γ2β(2β)8ϵ(1β)]q个2α+β.

这足以证明

  1. 函数(f)(q个)=q个e(电子)2q个+q个e(电子)q个βe(电子)2q个+2βe(电子)q个具有下限,并且

  2. 对于任何给定的γ,ϵ>0,β(0,1)这样的话
    0.01(1β)γ2β(2β)8ϵ(1β)>0
    (C4)

(f)(q个)通过检查其两侧的极限值

q个+(f)(q个)=0,q个(f)(q个)=q个(q个+β)[(e(电子)q个12)214]+βe(电子)q个=+,

人们可以看到(f)(q个)必须有一个下界。鉴于ϵ,γ>0,(C4)可以通过服用β(0,110.080.08+γ2/ϵ)因此,可以得出结论,这两个条件都可以满足,并且Langevin动力学(21)在所有可能的参数值下确实是遍历的。

1
总会计师。
滑膜炎
,
随机过程及其应用
(
施普林格
,
2016
).
2
D。
加梅尔曼
H。
洛佩斯
,马尔可夫链蒙特卡罗:贝叶斯推断的随机模拟第二版,查普曼和霍尔/CRC统计科学文本(Taylor&Francis,2006)。
三。
E.公司。
博尔戈诺沃
E.公司。
普利施克
,
欧洲药典。物件。
248
,
869
(
2016
).
4
A.P.公司。
吕巴特塞夫
答:。
拉克索宁
,
物理学。版本E
52
,
3730
(
1995
).
5
J。
哈利姆
,
十、。
、和
H。
,
《统计物理学杂志》。
168
,
146
(
2017
).
6
M。
托达
,
R。
库博
、和
N。
哈希苏姆
,
统计物理学II。非平衡统计力学
(
施普林格
,
1983
).
7
M。
头发
A.J.公司。
马伊达
,
非线性
23
,
909
(
2010
).
8
G.公司。
戈特瓦尔德
,
J。
沃梅尔
、和
J。
武泰
,
物理D非线性现象。
331
,
89
(
2016
).
10
答:。
马伊达
D。
,
非线性科学杂志。
26
,
233
(
2016
).
11
答:。
马伊达
D。
,
SIAM版本。
60
,
491
(
2018
).
12
答:。
马伊达
,
复杂系统中的湍流动力系统导论
(
施普林格
,
2016
).
13
年/月。
马尔佐克
,
H.N.公司。
纳吉姆
、和
洛杉矶。
拉恩
,
J.计算。物理学。
224
,
560
(
2007
).
14
Y。
马尔佐克
D。
,
Commun公司。计算。物理学。
6
,
826
(
2009
).
15
J.C.公司。
马丁利
,
上午。
斯图亚特
、和
D.J.博士。
海姆
,
斯托克。过程。他们的申请。
101
,
185
(
2002
).
16
J.R.公司。
单身一族
,
数学。计算。模型。
47
,
422
(
2008
).
17
C.E.公司。
Leith公司
,
J.大气。科学。
32
,
2022
(
1975
).
18
答:。
Gritsun公司
,
G.公司。
布兰斯塔
、和
答:。
马伊达
,
J.大气。科学。
65
,
2824
(
2008
).
19
R。
阿布拉莫夫
答:。
马伊达
,
非线性科学杂志。
18
,
303
(
2008
).
20
R。
阿布拉莫夫
答:。
马伊达
,
J.大气。科学。
66
,
286
(
2009
).
21
答:。
马伊达
十、。
,
Commun公司。数学。科学。
8
,
187
(
2010
).
22
R。
阿布拉莫夫
答:。
马伊达
,
《物理学杂志》。大洋洲。
42
,
243
(
2011
).
23
L。
妈妈
,
十、。
、和
C、。
线路接口单元
,
化学杂志。物理学。
145
,
204117
(
2016
).
24
E.公司。
艾萨克森
H.B.公司。
凯勒
,
数值方法分析
(
快递公司
,
2012
).
25
J·M·。
奥尔特加
西海岸。
莱茵博尔特
,
多变量非线性方程的迭代解法
(
暹罗
,
1970
),第30卷。
26
C.T.公司。
凯利
,
优化的迭代方法
(
暹罗
,
1999
).
27
第页。
Sheppard公司
,
M。
腊肠
、和
M。
卡马什
,
化学杂志。物理学。
136
,
034115
(
2012
).
28
国际货币基金组织。
索波尔
,
数学。模型。计算。支出。
1
,
407
(
1993
).
29
答:。
特拉托维奇
十、。
,电子打印arXiv公司:1706.04237(2017).
30
答:。
汉纳奇
答:。
奥尼尔
,
Q.J.R.Meteorol公司。Soc公司。
127
,
939
(
2001
).
31
D.F.公司。
安德森
J.C.公司。
马丁利
,
Commun公司。数学。科学。
9
(
1
),
301
318
(
2009
).
32
M。
罗森布拉特
,
安。数学。斯达。
27
,
832
(
1956
).
33
E.公司。
帕尔逊
,
安。数学。斯达。
33
,
1065
(
1962
).
34
答:。
斯莫拉
,
答:。
格雷顿
,
L。
歌曲
、和
B。
舍尔科夫
,英寸算法学习理论国际会议(Springer,2007),第13-31页。
35
共和国。
夸夫曼
美国。
拉丰
,
申请。计算。哈蒙。分析。
21
,
5
(
2006
).
36
T。
贝里
J。
哈莱姆
,
申请。计算。哈蒙。分析。
40
,
68
(
2016
).
37
T。
贝里
J。
哈利姆
,
周一。我们。版次。
145
,
2833
(
2017
).
38
美国。
J。
哈莱姆
,电子打印arXiv:1804.03272.
39
E.公司。
Jaynes公司
,
物理学。版次。
106
,
620
(
1957
).
40
西。
J。
哈利姆
,
Commun公司。申请。数学。计算。科学。
13
,
189
(
2018
).
41
西。
J。
哈利姆
,“补充材料:用于求解最大熵问题的方程式-方程法的MATLAB软件”,参见https://github.com/whao2008/EBE(2018)。
42
西。
诺伊德
,
化学杂志。物理学。
139
,
090901
(
2013
).