杂志的下一篇文章
函数核密度估计:时间序列异常检测的点和傅里叶方法
下一篇特刊文章
重要抽样的贝叶斯更新:所需样本量
期刊上的上一篇文章
一种基于遗传编程的实时作战低级指令机器人
特刊上一篇文章
部分Lotka–Volterra模型的数据驱动修正
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

随机Burgers方程的数据驱动模型约简

约翰霍普金斯大学数学系,美国马里兰州巴尔的摩北查尔斯街3400号,邮编:21218
2020,22(12), 1360;https://doi.org/10.3390/e22121360
收到的提交文件:2020年10月1日/修订日期:2020年11月29日/接受日期:2020年11月30日/发布日期:2020年11月30日

摘要

:
我们提出了一类一维随机Burgers方程的有效参数闭包模型。将其作为流图的统计学习,通过将未解析的高波数傅里叶模式表示为已解析变量轨迹的泛函,导出参数形式。简化模型为非线性自回归(NAR)时间序列模型,系数由最小二乘法估计。NAR模型能够准确地再现能量谱、不变密度和自相关。利用NAR模型的简单性,我们研究了最大时空约简。空间维数的减少是无限的,具有两个傅里叶模式的NAR模型可以很好地执行。NAR模型的稳定性限制了时间缩短,最大时间步长小于K型Galerkin系统。我们报告了一个最佳时空约简的潜在标准:NAR模型在时间步长处的能谱相对误差最小,其中K模式Galerkin系统的平均Courant–Friedrichs–Lewy(CFL)数与完整模型的平均值一致。

1.简介

闭包建模旨在为需要重复仿真的任务(如贝叶斯不确定性量化)提供计算高效的简化模型[1,2]和数据同化[,4]. 闭合模型由低维的已解变量组成,必须考虑未解变量的不可忽略影响,以便捕获短时动态和大时间统计。正如Mori–Zwanzig形式主义所建议的那样[5,6,7],轨迹近似不再合适,并且近似是在统计意义上的。也就是说,简化模型的目的是生成一个过程,该过程近似于分布中的目标过程,或者至少重现感兴趣数量的关键统计数据和动态。对于一般非线性系统,这种简化的闭合模型是无法从第一性原理直接导出的。
基于统计学习方法的数据驱动方法为模型简化提供了有用和实用的工具。过去几十年见证了数据驱动策略的革命性发展,包括参数模型(参见,例如[8,9,10,11,12,13,14]以及其中的参考)非参数和机器学习方法(参见,例如[15,16,17,18]). 这些发展要求从动力系统的角度系统地理解模型简化(参见,例如[7,19,20]),数值近似[21,22]和统计学习[17,23].
以一维随机Burgers方程为原型模型,我们旨在从可解释的统计推断角度进一步理解模型约简。更具体地说,我们考虑一个随机Burgers方程的周期解 [ 0 , 2 π ] :
u个 t吨 = ν u个 x个 x个 负极 u个 u个 x个 + (f) ( x个 , t吨 ) , 0 < x个 < 2 π , t吨 > 0 u个 ( 0 , t吨 ) = u个 ( 2 π , t吨 ) = 0 , u个 x个 ( 0 , t吨 ) = u个 x个 ( 2 π , t吨 ) ,
从初始条件 u个 ( · , 0 ) .我们考虑随机力 (f) ( x个 , t吨 ) 空间平滑 K(K) 0 低波数傅里叶模式和白色时间,由下式给出
(f) ( x个 , t吨 ) = σ = 1 K(K) 0 ( x个 ) W公司 ˙ ( t吨 ) + 余弦 ( x个 ) W公司 ˙ ( t吨 ) ,
哪里 { W公司 , W公司 } 是独立的布朗运动。在这里 ν > 0 是粘度常数 σ > 0 表示随机力的强度。
我们的目标是为第一个K(K)傅里叶模式,以便有效地再现这些模式的能量谱和其他统计数据。
我们提出了一类一维随机Burgers方程的有效参数化约化闭包模型。其关键思想是统计地近似离散时间流图,特别是将未解析的高波数傅里叶模式表示为已解析变量轨迹的泛函。简化模型是非线性自回归(NAR)时间序列模型,其系数仅通过最小二乘法从数据中估计。我们在四种环境中测试NAR模型:确定性响应的减少( K(K) > K(K) 0 )vs.涉及未解决随机力的简化( K(K) < K(K) 0 )以及小规模与大规模随机力( σ = 0.2 σ = 1 ),其中 K(K) 0 是白时随机力的傅里叶模式数 σ 是力的大小。在所有这些设置中,NAR模型可以准确地再现能量谱、不变密度和自相关函数(ACF)。我们还讨论了模型选择、估计量的一致性以及简化模型的存储长度。
利用NAR模型的简单性,我们进一步研究了(随机)偏微分方程模型约简中的一个关键问题:最大时空约简。在我们的参数推断方法中,空间维数可以任意降低:具有两个傅里叶模式的NAR模型表现良好。时间缩短是另一回事。最大时间步长受NAR模型稳定性的限制,且小于K模式Galerkin系统。数值试验表明,NAR模型在K模式Galerkin系统的平均CFL(Courant–Friedrichs–Lewy)数与完整模型一致的时间步长处实现了最小的相对误差,这表明了最佳时空缩减的潜在标准。
我们可以很容易地将我们的参数闭包建模策略扩展到一般非线性耗散系统,使其超越二次非线性。连同[14],我们可以将其视为非线性伽辽金方法的参数推理扩展[24,25,26,27]. 然而,它不需要惯性流形的存在(并且随机Burgers方程不满足足以存在惯性流形的谱隙条件[28]),它适用于任何维度的已解析变量(例如,如果存在,则低于惯性歧管的维度[14]). 值得注意的是,可以使用参数线性的NAR模型,并通过最小二乘法进行估计。因此,该算法具有计算效率,并且对于大型系统具有可扩展性。
参数建模方法的局限性在于其依赖于使用Picard迭代推导参数形式,这取决于未解析变量的非线性(参见第3.1节). 当非线性较复杂时,可能无法获得线性内参数安萨茨。人们可以通过非参数技术克服这一局限性[23,29]和机器学习方法(参见,例如[16,17,30]).
随机伯格方程是开发湍流闭合建模技术的原型模型(参见[31,32,33,34,35,36,37]). 特别是,Dolaptchiev等人[37]基于有限差分离散化的局部平均值,提出了相似条件下随机Burgers方程的闭合模型,再现了与本研究类似的精确能谱。我们直接为傅里叶模式构造了一个简单而有效的NAR模型,为模型简化的统计推断检验提供了基础。
我们注意到,基于参数推理的闭包简化模型不同于广泛研究的基于参数全模型的固有正交分解(POD)降阶模型(ROM)[38,39]. 这些POD-ROM寻求新的有效基础,以通过线性系统捕获整个参数全模型族的有效动力学。基于推断的闭包模型关注给定基础上的非线性动力学,旨在捕获短时动力学和大时间统计。从概率的角度来看,这两种方法都近似于目标随机过程:POD-ROM基于Karhunen-Loéve展开,而基于推理的闭包模型旨在学习非线性流映射。可以将两者结合起来,在POD基础上找到非线性动力学的非线性闭合模型。
对我们研究的阐述如下。我们首先总结了表1在简要回顾了随机Burgers方程及其数值积分的基本性质之后,我们在第2节闭包建模的推理方法,并与非线性Galerkin方法进行比较。第3节介绍了NAR模型的推理:参数形式的推导、参数估计和模型选择。在以下四种设置中检查NAR模型的性能第4节,我们研究了时空约简。第5节总结了我们的主要发现和未来可能的研究。

2.随机Burgers方程的时空约简

在本节中,我们首先回顾随机Burgers方程及其数值积分的基本性质。然后,我们介绍了基于推理的模型约简,并将其与非线性Galerkin方法进行了比较。

2.1. 随机Burgers方程

方程的傅里叶变换 ( 1 ) 导致
d日 d日 t吨 u个 ^ k个 = 负极 ν q个 k个 2 u个 ^ k个 负极 q个 k个 2 = 负极 u个 ^ u个 ^ k个 负极 + (f) ^ k个 ( t吨 )
具有 q个 k个 = k个 , k个 Z轴 ,其中 u个 ^ k个 是傅里叶模式:
u个 ^ k个 ( t吨 ) = F类 [ u个 ] k个 = 1 2 π 0 2 π u个 ( x个 , t吨 ) 电子 负极 q个 k个 x个 d日 x个 , u个 ( x个 , t吨 ) = F类 负极 1 [ u个 ^ ] = k个 u个 ^ k个 ( t吨 ) 电子 q个 k个 x个 ,
系统具有以下属性。首先,它是伽利略不变量:如果 u个 ( x个 , t吨 ) 是一个解决方案,那么 u个 ( x个 负极 c(c) t吨 , t吨 ) + c(c) ,使用c(c)任意恒定速度是一种解决方案。要看到这一点,让 v(v) ( x个 , t吨 ) = u个 ( x个 负极 c(c) t吨 , t吨 ) + c(c) .然后, v(v) t吨 = 负极 c(c) u个 x个 + u个 t吨 , v(v) x个 = u个 x个 、和
v(v) t吨 = c(c) v(v) x个 + u个 x个 x个 + u个 u个 x个 + (f) = c(c) v(v) x个 + v(v) x个 x个 + ( v(v) 负极 c(c) ) v(v) x个 + (f) = v(v) x个 x个 + v(v) v(v) x个 + (f) .
在不失一般性的情况下,我们设置 0 2 π u个 ( x个 , 0 ) d日 x个 = 0 。这意味着 u个 ^ 0 ( 0 ) = 0 在本研究中,我们只考虑平均值为零的力,即。, 0 2 π (f) ( x个 , t吨 ) d日 x个 = 0 ,因此根据方程式(),我们看到了 u个 ^ 0 ( t吨 ) 0 ,或等效的, 0 2 π u个 ( x个 , t吨 ) d日 x个 0 第二,系统具有不变测度[31,40,41]由于耗散能量的扩散项和注入能量的随机力之间的平衡。特别是,初始条件不影响解的大时间统计性质。第三,自u个是真实的,傅里叶模式满足 u个 ^ 负极 k个 = u个 ^ k个 * ,其中 u个 ^ k个 * 是的复共轭 u个 ^ k个 .

2.2. 伽辽金谱法

我们考虑了求解Burgers方程数值解的Galerkin谱方法。系统近似如下:函数 u个 ( x个 , t吨 ) 在网格点处表示 x个 = Δ x个 具有 = 0 , , 2 N个 负极 1 Δ x个 = 2 π 2 N个 傅里叶变换 F类 被离散傅里叶变换取代
u个 ^ k个 ( t吨 ) = F类 2 N个 [ u个 ] k个 = = 0 2 N个 负极 1 u个 ( x个 , t吨 ) 电子 负极 q个 k个 x个 , u个 ( x个 , t吨 ) = F类 2 N个 负极 1 [ u个 ^ ] = 1 2 N个 k个 = 负极 N个 + 1 N个 u个 ^ k个 电子 q个 k个 x个 .
为了简化符号,我们滥用了符号 u个 ( x个 , t吨 ) 因此,它表示真实的解决方案或其高分辨率 2 N个 -模式近似。u个是真的,我们有 u个 ^ 负极 k个 = u个 ^ k个 * .进一步注意 u个 ^ 0 = 0 由于伽利略不变性和设置 u个 ^ N个 = 0 ,我们得到一个截断系统
d日 d日 t吨 u个 ^ k个 = 负极 ν q个 k个 2 u个 ^ k个 负极 k个 2 | k个 负极 | N个 , | | N个 u个 ^ u个 ^ k个 负极 + (f) ^ k个 , 具有 | k个 | = 1 , , N个 .
我们解方程(4)使用指数时间差分四阶Rouge–Kutta方法(ETDRK4)(参见[42,43])带有标准 / 2 零对零处理(参见例如[44]),带有力项 (f) ^ k个 在每个时间步长中被视为常量。这种混合格式是强1阶格式,但它的优点是既保持了ETDRK4的数值稳定性,又保持了Euler–Maruyama的简单性。
我们将考虑相对较小的粘度 ν = 0.02 ,因此随机冲击将出现在解决方案中。一般来说,较小的粘度常数需要较高的时空分辨率来解析解,特别是当 ν 消失了。为了充分解决这个问题,我们设置 N个 = 128 d日 t吨 = 0.001 解决方案得到准确解析,平均Courant–Friedrichs–Lewy(CFL)数值分别为0.139和0.045 σ = 1 σ = 0.2 分别是。这里,平均CFL数计算为沿轨迹的平均值 N个 t吨 = 10 5 步骤
平均值 紧凑型荧光灯 = 1 N个 t吨 n个 = 1 N个 t吨 啜饮 x个 | u个 ( x个 , t吨 n个 ) | Δ t吨 Δ x个 ,
哪里 Δ t吨 Δ x个 分别是时间步长和空间步长。此外,数值测试表明,边缘密度随着轨迹长度的增加而收敛。

2.3. 非线性伽辽金与推理模型约简

为了便于记法,我们将Burgers方程写成算子形式
t吨 u个 + A类 u个 = B类 ( u个 ) + (f) , u个 ( 0 ) = u个 0
使用线性运算符 A类 : 小时 0 1 ( 0 , 2 π ) L(左) 2 ( 0 , 2 π ) 和一个非线性算子 B类 : 小时 0 1 ( 0 , 2 π ) L(左) 2 ( 0 , 2 π )
A类 = 负极 ν x个 x个 , B类 ( u个 ) = 负极 ( u个 2 ) x个 / 2 .
我们首先分解u个分为已解析和未解析变量。回想一下,我们的模型简化目标是导出一个能够忠实描述系数动态的封闭系统 { u个 ^ k个 ( t吨 ) } | k个 | = 1 K(K) 或等效的低维过程 v(v) ( x个 , t吨 ) = | k个 | = 1 K(K) u个 ^ k个 ( t吨 ) 电子 q个 k个 x个 .
表示方式P(P)投影运算符来自 小时 0 1 ( 0 , 2 π ) 跨度 { 电子 q个 k个 x个 } | k个 | = 1 K(K) ,并让 : = 负极 P(P) (为了简化符号,我们还将它们表示为傅里叶模式对应向量空间上的投影)。使用 u个 = P(P) u个 + u个 = v(v) + w个 ,我们可以编写系统(5)作为
(6) d日 v(v) d日 t吨 = 负极 P(P) A类 v(v) + P(P) B类 ( v(v) ) + P(P) (f) + [ P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ] , (7) d日 w个 d日 t吨 = 负极 A类 w个 + B类 ( v(v) + w个 ) + (f) .
为查找封闭系统v(v),我们量化了截断误差 P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) 在(6)中,表示低波数模式和高波数模式之间的非线性相互作用,通过以下任一函数v(v)或轨道的函数v(v)特别是,在基于惯性流形理论的非线性Galerkin方法中[24,25,26,27]),一个旨在代表高级模式w个作为低模式的函数v(v)(从而获得近似惯性流形)。在最简单的实现中,忽略等式(7)中的时间导数并求解 w个 = ψ ( v(v) )
w个 负极 ( A类 ) 负极 1 [ B类 ( v(v) + w个 ) + (f) ]
通过定点迭代: ψ 0 = 0 , ψ + 1 = 负极 ( A类 ) 负极 1 [ B类 ( u个 + ψ ) + (f) ] 。这导致近似值为w个作为的函数v(v),如果存在K(K)足够大并且系统满足间隙条件(因此存在惯性流形)。然而,在许多具有全局吸引子的耗散系统中,只有少数被证明满足间隙条件(参见[28]用于最近的审查)。更重要的是,我们不能总是期望K(K)大于惯性流形的尺寸,这通常是未知的。因此,这种非线性Galerkin方法既不适用于没有惯性流形的系统,也不适用于K(K)小于惯性歧管的尺寸。
我们对减排持不同的看法。与非线性Galerkin的目标是轨迹近似不同,我们的目标是随机过程分布的概率近似 ( v(v) ( · , t吨 ) , t吨 0 ) .过程的随机性v(v)可以来自随机初始条件和/或随机力。我们强调,关键在于表示模型误差的相关性 P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) 关于过程v(v),而不是简单地构造一个具有相同分布的随机过程 P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ,可能独立于v(v).
在数据驱动的方法中,这种概率近似自然会导致对潜在过程的统计推断,旨在表示模型误差 [ P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ] ( t吨 ) 作为过去轨迹的函数 ( v(v) ( · , ) , t吨 ) 这种推断约简方法在一般设置下工作灵活:不需要惯性流形和尺寸K(K)可以是任意的(例如,小于惯性歧管的尺寸,如[14]).
时空缩减。为了实现实际计算的时空约简,约简模型应该是具有时间步长的时间序列模型 δ > d日 t吨 减少时间,而不是差分系统。它近似于流图( t吨 n个 = n个 δ )
u个 ^ k个 ( t吨 n个 + 1 ) = F类 ( u个 ^ · ( t吨 n个 ) , (f) ^ · ( [ t吨 n个 : t吨 n个 + 1 ] ) ) k个 , | k个 | K(K) ,
哪里 u个 ^ · ( t吨 n个 ) = ( u个 ^ k个 ( t吨 n个 ) , | k个 | 0 ) 是所有傅里叶模式的矢量,因此,上述映射不是低模式的闭合系统。回忆一下 | k个 | K(K) ,
d日 d日 t吨 u个 ^ k个 = 负极 ν q个 k个 2 u个 ^ k个 负极 k个 2 | k个 负极 | K(K) , | | K(K) u个 ^ u个 ^ k个 负极 K(K) - 模式 截断 负极 q个 k个 2 | k个 负极 | > K(K) | | > K(K) u个 ^ u个 ^ k个 负极 截断 错误 + (f) ^ k个 ( t吨 )
显然,K模截断Galerkin系统可以直接近似于F类英寸(8). 利用它,我们提出了一个时间序列模型 { u个 ^ k个 ( t吨 n个 ) } | k个 | = 1 K(K) 以…的形式
u个 k个 n个 + 1 = u个 k个 n个 + δ [ R(右) k个 δ ( u个 n个 ) + (f) k个 n个 + Φ k个 n个 ] + k个 n个 + 1 , | k个 | K(K) ,
哪里 R(右) · δ ( u个 n个 ) 是由一步向前积分器产生的,时间步长为 δ 确定性的K(K)-模式Galerkin,和 (f) k个 n个 = (f) ^ k个 ( t吨 n个 ) 是白噪音k个时间随机力的第个傅里叶模式 t吨 n个 这里是术语 Φ n个 和噪音 n个 + 1 目的表示截断误差和离散化误差。连同中的其他术语(10),它们提供了流图的统计近似值F类英寸(8). 特别是,术语 Φ n个 近似值F类基于最新信息n个(例如,条件期望)和噪声 n个 + 1 目的是统计地表示近似值的残差。由于截断误差取决于过去低波数模式的历史,正如Mori–Zwanzig公式所建议的那样[6,7],我们制造 Φ n个 取决于轨迹 u个 1 : n个 状态过程以及轨迹 (f) 1 : n个 1 : n个 :
Φ n个 : = Φ ( u个 1 : n个 , (f) 1 : n个 , 1 : n个 ) .
为了简单起见,我们假设噪声 { n个 } 为iid高斯,并且生成的时间序列模型(10)是一个非线性自回归滑动平均模型(NARMA)[13,45,46].
方程式的右侧(10),与 Φ n个 在公式中定义(11),旨在对离散时间映射进行统计近似(8). 然而,方程式中的一般形式(11)导致从数据中学习高维函数,由于众所周知的维数灾难,使用全局或局部多项式基的回归方法很难解决这一问题。幸运的是,物理模型提供了信息结构来降低维数,并且我们可以仅基于有限内存的几个基函数获得有效的近似值。在下一节中,我们从物理模型导出简化模型的参数形式,其系数可以从数据中有效估计。
为了避免符号之间的混淆,我们总结了完整模型和简化模型之间变量的对应关系表2.

3.简化模型的推断

本文介绍了NAR模型的参数推断:参数形式的推导、参数估计和模型选择。

3.1. 参数化简化模型的推导

我们通过从方程(6)的数值积分中提取基函数来导出参数简化模型。这些基本函数的组合将为我们提供 Φ ( u个 1 : n个 , (f) 1 : n个 , 1 : n个 ) 英寸(11),它近似于流图 { F类 ( u个 ^ · ( t吨 n个 ) , (f) ^ · ( [ t吨 n个 : t吨 n个 + 1 ] ) ) k个 , | k个 | K(K) } 英寸(8)在统计学意义上。
我们首先为低模过程编写一个封闭的积分-微分系统 ( v(v) ( · , t吨 ) , t吨 0 ) 根据方程(6),这可以通过对高模方程进行积分来实现w个在方程式(7)中:
d日 v(v) d日 t吨 = 负极 P(P) A类 v(v) + P(P) B类 ( v(v) ) + P(P) (f) + [ P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ] , w个 ( t吨 ) = 电子 负极 A类 τ w个 ( t吨 负极 τ ) + t吨 负极 τ t吨 电子 负极 A类 ( t吨 负极 ) [ B类 ( v(v) ( ) + w个 ( ) ) + (f) ( ) ] d日 ,
哪里 τ [ 0 , t吨 ] 注意,除了轨迹 ( v(v) ( · , ) , [ t吨 负极 τ , t吨 ] ) ( (f) ( ) , [ t吨 负极 τ , t吨 ] ) 我们可以假设已知的状态 w个 ( · , t吨 ) 也取决于初始条件 w个 ( · , t吨 负极 τ ) 因此,该方程不是严格封闭的。然而,作为 τ 增加时,初始条件的影响呈指数衰减,从而允许可能的有限时间近似闭合。鉴于 w个 ( · , t吨 负极 τ ) ( (f) ( ) , [ t吨 负极 τ , t吨 ] ) ,Picard迭代可以为我们提供一个近似值w个作为轨道的函数v(v)也就是说,函数的顺序 { w个 ( ) } ,由定义
w个 ( + 1 ) ( t吨 ) = 电子 负极 A类 τ w个 ( ) ( t吨 负极 τ ) + t吨 负极 τ t吨 电子 负极 A类 ( t吨 负极 ) [ B类 ( v(v) ( ) + w个 ( ) ( ) ) + (f) ( ) ] d日 ,
具有 w个 ( 0 ) ( ) = 0 对于 [ t吨 负极 τ , t吨 ] ,将收敛到w个作为 尤其是第一个Picard迭代
w个 ( 1 ) ( t吨 ) = t吨 负极 τ t吨 电子 负极 A类 ( t吨 负极 ) [ B类 ( v(v) ( ) ) + (f) ( ) ] d日
为我们提供了一个封闭表示:从其数值积分器中,我们可以导出简化模型的参数项。我们强调,目标是导出统计推断的参数项,而不是获得轨迹近似。因此,高阶数值积分或高阶Picard迭代是有用的,但可能会使参数化复杂化。为了简单起见,我们只考虑该积分的第一次Picard迭代和黎曼和近似。
我们现在可以从上述积分-微分方程中提出参数化数值简化模型。在一个简单的形式中,我们将第一次Picard迭代的Riemann和近似和微分方程的数值格式参数化,以获得
v(v) ( t吨 n个 ) v(v) ( t吨 n个 负极 1 ) + 1 δ R(右) δ ( v(v) ( t吨 n个 负极 1 ) ) + 2 δ P(P) (f) ( t吨 n个 负极 1 ) + δ [ P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ] ( t吨 n个 负极 1 ) , w个 ( t吨 n个 负极 1 ) j个 = 0 第页 c(c) j个 电子 负极 A类 j个 δ [ B类 ( v(v) ( t吨 n个 负极 j个 ) ) + (f) ( t吨 n个 负极 j个 ) ] .
在这里 δ = t吨 n个 负极 t吨 n个 负极 1 表示时间步长,非线性函数 R(右) δ ( · ) 来自确定性截断Galerkin方程的数值积分 d日 v(v) d日 t吨 负极 P(P) A类 v(v) + P(P) B类 ( v(v) ) 时间 t吨 n个 负极 1 和时间步长 δ 、和系数 ( 1 , 2 , c(c) j个 ) 是通过在统计意义上拟合数据来估计的。为了将简化模型中的近似过程与原始过程区分开来,我们将其表示为 v(v) n个 ,并将简化模型写为
(14a) v(v) n个 = v(v) n个 负极 1 + 1 δ R(右) δ ( v(v) n个 负极 1 ) + 2 δ P(P) (f) ( t吨 n个 负极 1 ) + δ [ P(P) B类 ( v(v) n个 负极 1 + w个 n个 负极 1 ) 负极 P(P) B类 ( v(v) n个 负极 1 ) ] + n个 , (14b) w个 n个 负极 1 = j个 = 1 第页 c(c) j个 电子 负极 A类 j个 δ [ B类 ( v(v) n个 负极 j个 ) + (f) ( t吨 n个 负极 j个 ) ] ,
哪里 { n个 } 是表示残差的过程,为了简单起见,可以假设为随机力,但也可以假设为移动平均部分,以便更好地捕捉时间相关性,如[13,46]. 第二个方程(14b)没有残差项,因为它的目标是提供一组基本函数来近似正向映射 v(v) ( t吨 n个 ) = F类 ( v(v) ( t吨 n个 负极 1 ) , w个 ( t吨 n个 负极 1 ) , (f) ) 如方程式所示(8),而不是为高级模式建模。
请注意,时间步长 δ 可以相对较大,只要截断Galerkin方程 d日 v(v) d日 t吨 负极 P(P) A类 v(v) + P(P) B类 ( v(v) ) 慢变量的v(v)可以合理解决。通常,这样的步长可能比解决快速过程所需的时间步长大得多w个,因为在拟合系数时,未解决的快速过程的影响在统计上是“平均的” ( 1 , 2 , c(c) j个 ) 到数据。此外,还统计地考虑了离散化中的数值误差。
理论上,方程(14a)的右侧是条件期望的近似值 电子 v(v) ( t吨 n个 ) | v(v) ( t吨 n个 负极 第页 : n个 负极 1 ) , P(P) (f) ( t吨 n个 负极 第页 : n个 负极 1 ) ,哪个是最佳的 L(左) 2 基于信息更新时间的前向映射估计 t吨 n个 负极 1 。这里 L(左) 2 是关于向量的联合度量 ( v(v) ( t吨 · 负极 第页 : · 负极 1 ) , P(P) (f) ( t吨 · 负极 第页 : · 负极 1 ) ) ,这是在拟合数据时由他们的联合经验测量值近似得出的。
为了避免非线性优化,可以通过删除参数中的非线性项(即二次项),将参数形式进一步简化为与系数线性相关。事实上,回想一下Burgers方程 B类 ( u个 ) = u个 u个 x个 P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) = v(v) x个 w个 + v(v) w个 x个 + w个 w个 x个 通过降低高模式之间的相互作用 w个 w个 x个 和近似值
P(P) B类 ( v(v) n个 负极 1 + w个 n个 负极 1 ) 负极 P(P) B类 ( v(v) n个 负极 1 ) v(v) x个 n个 负极 1 w个 n个 负极 1 + v(v) n个 负极 1 w个 x个 n个 负极 1
在(14a)中,我们得到了一个与系数线性相关的简化模型 { j个 , c(c) j个 } .

3.2. 傅里叶模式下的数值简化模型

我们现在用傅里叶模式写出简化模型,如方程所示(10).
如上一节所述,主要任务是将截断误差参数化 P(P) B类 ( v(v) + w个 ) k个 负极 P(P) B类 ( v(v) ) k个 。回想一下,操作员P(P)项目u个到波数为的模式 1 | k个 | K(K) 双线性函数 P(P) B类 ( v(v) ) k个 = u个 ^ u个 ^ k个 负极 (以下,为了简化符号,我们还表示P(P)对应的傅里叶模式向量空间)。
P(P) B类 ( v(v) + w个 ) k个 负极 P(P) B类 ( v(v) ) k个 = 负极 k个 2 | | > K(K) | k个 负极 | > K(K) u个 ^ u个 ^ k个 负极 .
由于二次项 B类 ( v(v) ) 只能从 ( u个 ^ k个 , 1 | k个 | K(K) ) 波数小于的模式 2 K(K) + 1 ,我们只得到具有波数的高模 K(K) < | k个 | 2 K(K) 当我们计算w个通过的一次迭代 B类 ( v(v) ) (为了简单起见,我们使用一次迭代,但可以通过多次迭代以更复杂的参数形式为代价获得更高的波数。)因此,在单次迭代近似中,截断误差将涉及第一次迭代 2 K(K) 傅里叶模式:
P(P) B类 ( v(v) + w个 ) k个 负极 P(P) B类 ( v(v) ) k个 负极 k个 2 K(K) < | k个 负极 | 2 K(K) K(K) < | | 2 K(K) u个 ^ u个 ^ k个 负极 .
为了避免参数估计中的非线性优化,我们去掉了高模之间的相互作用
P(P) B类 ( v(v) + w个 ) k个 负极 P(P) B类 ( v(v) ) k个 负极 k个 2 | k个 负极 | K(K) , K(K) < | | 2 K(K) | | K(K) , K(K) < | k个 负极 | 2 K(K) u个 ^ u个 ^ k个 负极 .
我们近似于高模 ( u个 ^ k个 , K(K) < | k个 | 2 K(K) ) 通过(14b)中的低模式函数,
u个 ^ k个 ( t吨 n个 负极 1 ) j个 = 1 第页 c(c) k个 , j个 电子 负极 A类 j个 δ [ u个 ˜ k个 ( t吨 n个 负极 j个 ) + (f) ^ k个 ( t吨 n个 负极 1 ) ] , K(K) < | k个 | 2 K(K)
哪里 u个 ˜ k个 是非线性函数的高阶模态 B类 ( v(v) ) :
u个 ˜ k个 = B类 ( v(v) ) k个 = 负极 k个 2 | | K(K) , | k个 负极 | K(K) u个 ^ u个 ^ k个 负极 , 对于 K(K) < | k个 | 2 K(K) .
在这里 B类 ( v(v) ) 仅表示波数以下的模式 2 K(K) 由于二次非线性仅涉及双波数之间的相互作用。通过二次相互作用的迭代,可以获得更高的波数。
截断误差项现在可以线性参数化为
[ P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) ] k个 ( t吨 n个 ) ) 负极 q个 k个 2 j个 = 0 第页 c(c) k个 , j个 电子 负极 A类 j个 δ | k个 负极 | K(K) , K(K) < | | 2 K(K) | | K(K) , K(K) < | k个 负极 | 2 K(K) u个 ˜ ( t吨 n个 ) u个 ˜ k个 负极 ( t吨 n个 负极 j个 ) ,
其中我们还表示 u个 ˜ k个 = u个 ^ k个 对于 | k个 | K(K) 为了简化符号。
我们现在已经得到了傅里叶模式的参数化数值简化模型。表示 u个 n个 = ( u个 k个 n个 , | k个 | K(K) ) C类 K(K) 简化模型中接近原始低模的低模 ( u个 ^ k个 ( t吨 n个 ) , | k个 | K(K) ) 。简化模型为
(17a) u个 k个 n个 = u个 k个 n个 负极 1 + δ [ R(右) δ ( u个 · n个 负极 1 ) + (f) k个 n个 + Φ k个 n个 ] + k个 n个 , 1 k个 K(K) , (17亿) Φ k个 n个 = j个 = 1 第页 c(c) k个 , j个 v(v) u个 k个 n个 负极 j个 + c(c) k个 , j个 R(右) R(右) δ ( u个 · n个 负极 j个 ) + c(c) k个 , j个 (f) (f) k个 n个 负极 j个 + c(c) k个 , j个 w个 | k个 负极 | K(K) , K(K) < | | 2 K(K) | | K(K) , K(K) < | k个 负极 | 2 K(K) u个 ˜ n个 负极 1 u个 ˜ k个 负极 n个 负极 j个
按照惯例 u个 负极 k个 n个 = ( u个 k个 n个 ) * (带上标 * 表示复共轭),以及其中的概念 u个 ˜ n个 负极 j个 表示高模式,由定义
u个 ˜ k个 n个 负极 j个 = u个 k个 n个 负极 j个 , 1 k个 K(K) ; q个 k个 2 电子 负极 ν q个 k个 2 j个 δ | | K(K) , | k个 负极 | K(K) u个 k个 负极 n个 负极 j个 u个 n个 负极 j个 , K(K) < k个 2 K(K) .
简化模型采用非线性自回归滑动平均(NARMA)模型的形式:
  • 地图 R(右) δ ( · ) : C类 K(K) C类 K(K) 是确定性的向前1步K(K)-模式Galerkin截断方程 d日 v(v) d日 t吨 = 负极 P(P) A类 v(v) + P(P) B类 ( v(v) ) 使用具有时间步长的数值积分格式 δ 即。, v(v) n个 + 1 = v(v) n个 + δ R(右) δ ( v(v) n个 ) 。我们使用ETDRK4方案。
  • 术语 (f) k个 n个 表示k个-时间间隔内随机力的第个傅里叶模式 [ t吨 n个 负极 1 , t吨 n个 ] ,按缩放 1 / δ ,它与 R(右) δ 因此,简化模型可以线性量化低阶模态对随机力的响应。
  • 功能 Φ k个 n个 : = Φ k个 n个 ( u个 n个 负极 第页 : n个 负极 1 , (f) n个 负极 第页 : n个 负极 1 ) 是一个函数 C类 K(K) 第页 + K(K) 第页 C类 K(K) 带参数 θ = ( c(c) v(v) , c(c) R(右) , c(c) (f) , c(c) w个 ) R(右) 4 K(K) 第页 根据数据进行估算。特别是,系数 c(c) k个 , 1 v(v) c(c) k个 , 1 R(右) 作为对截断方程的积分的校正。
  • 新的噪音术语 { n个 C类 K(K) } 为简单起见,假设为与原始随机力无关的白噪声 ( (f) n个 ) 也就是说,我们假设 { n个 } 是独立的同分布(iid)高斯随机向量序列,具有独立的实部和虚部,分布为 N个 ( 0 , 诊断 ( σ k个 ) ) 具有 σ k个 根据数据进行估算。在这种白噪声假设下,可以简单地用最小二乘法估计参数(见下一节)。一般来说,还可以假设 n个 ,或其他结构,如移动平均线 { n个 : = ξ n个 + j个 = 1 q个 c(c) j个 ξ n个 负极 j个 } 具有 { ξ n个 } 是一个白噪声序列[13,46].

3.3. 数据生成和参数估计

我们通过最大化数据的可能性来估计NAR模型的参数。
NAR模型的数据。为了推导方程(17)形式的简化模型,我们从数值方案中生成相关数据,该数值方案在空间和时间上充分解析了系统,如第2.2节相关数据是状态的低阶模态和随机力的轨迹,即。, { u个 ^ k个 ( t吨 n个 ) , (f) ^ k个 ( t吨 n个 ) } 对于 | k个 | K(K) n个 0 ,它们被视为 { u个 k个 n个 , (f) k个 n个 } 在简化模型中。这里,时间瞬间是 t吨 n个 = n个 δ ,其中 δ 可以比时间步长大得多 d日 t吨 需要解析系统。此外,数据不包括高模式。简而言之,数据是由系统高分辨率解决方案的空间和时间降采样生成的。
数据可以是长轨迹,也可以是多个独立的短轨迹。我们表示数据包括M(M)独立轨迹
数据 : { u个 k个 1 : N个 t吨 , , (f) k个 1 : N个 t吨 , } , k个 = 1 M(M) , K(K) 具有 u个 k个 1 : N个 t吨 , = u个 ^ k个 ( t吨 1 : N个 t吨 ) ( ) , (f) k个 1 : N个 t吨 , = (f) ^ k个 ( t吨 1 : N个 t吨 ) ( ) ,
哪里索引轨迹, t吨 n个 = n个 δ 具有 δ 是两次观测之间的时间间隔,以及 N个 t吨 表示每条轨迹的步数,
参数估计。离散时间简化模型方程(17)中的参数通过最大似然方法进行估计。我们的离散时间简化模型有几个吸引人的特点:(i)似然函数可以精确计算,避免了可能导致估计偏差的近似误差;(ii)在假设过程 { n个 } 是白噪声,避免了耗时的非线性优化。
假设 { n个 } 是白噪声,参数可以用最小二乘法简单估计,因为方程(17)中的简化模型与参数线性相关。更准确地说,数据的对数似然 { u个 1 : N个 t吨 , , (f) 1 : N个 t吨 , } = 1 M(M) 英寸(19)可以写为
( θ , σ ) = 负极 | k个 | K(K) 日志 σ k个 + n个 , = 1 T型 , M(M) | u个 k个 n个 , 负极 u个 k个 n个 负极 1 , + δ R(右) δ ( u个 k个 n个 负极 1 , ) + δ (f) k个 n个 , + δ Φ k个 n个 , ( θ ) | 2 2 M(M) T型 σ k个 ,
哪里 | · | 表示复数的绝对值, θ = ( c(c) v(v) , c(c) R(右) , c(c) (f) , c(c) w个 ) R(右) 4 K(K) 第页 σ = ( σ 1 , , σ K(K) ) R(右) K(K) 计算参数的最大似然估计器(MLE) ( θ , σ ) ,我们注意到 Φ k个 n个 ( θ ) in(17b)与参数线性相关 θ 因此 θ σ 可以通过求似然函数梯度的零点来进行分析计算。更准确地说,是指
Φ k个 n个 ( θ ) = j个 = 1 4 第页 θ j个 Φ k个 , j个 n个
具有 Φ k个 , j个 n个 表示(17b)中的参数化项,我们将MLE计算为
θ ^ k个 = ( A类 k个 ) 负极 1 b条 k个 , 1 k个 K(K) , σ ^ k个 = 1 M(M) T型 n个 , = 1 T型 , M(M) u个 k个 n个 , 负极 u个 k个 n个 负极 1 , + δ R(右) δ ( u个 k个 n个 负极 1 , ) + δ (f) k个 n个 , + δ Φ k个 n个 , ( θ ^ ) 2
其中正规矩阵 A类 k个 和向量 b条 k个 由定义
A类 k个 ( j个 , j个 ) = δ M(M) T型 n个 , = 1 T型 , M(M) Φ k个 , j个 n个 , , Φ k个 , j个 n个 , , 1 j个 , j个 4 第页 , b条 k个 ( j个 ) = 1 M(M) T型 n个 , = 1 T型 , M(M) u个 k个 n个 , 负极 u个 k个 n个 负极 1 , + δ R(右) δ ( u个 k个 n个 负极 1 , ) + δ (f) k个 n个 , , Φ k个 , j个 n个 , .
实际上, A类 k个 可以是奇异的,可以通过伪逆或正则化处理。为了简单起见,我们假设随机力具有独立分量,因此可以通过简单的最小二乘回归估计系数。人们可以通过考虑各组成部分之间的空间相关性来进一步改进NAR模型或者使用移动平均模型[13,46,47].

3.4。型号选择

方程(17b)中的参数形式使一系列简化模型的许多自由度未被确定,例如时滞第页以及可能的冗余术语。为了避免过拟合和冗余,我们建议按照以下准则选择简化模型。
  • 交叉验证:简化模型应稳定,并能再现解析过程的分布,尤其是主要的动态统计特性。我们将考虑能量谱、边际不变密度和时间相关性:
    能源 光谱 : 电子 | u个 ^ k个 | 2 = N个 t吨 M(M) 1 N个 t吨 M(M) , n个 = 1 M(M) , N个 t吨 | u个 ^ k个 ( t吨 n个 ) ( ) | 2 ; 不变量 密度 属于 重新 ( u个 ^ k个 ) : 第页 k个 ( z(z) ) d日 z(z) = N个 t吨 M(M) 1 N个 t吨 M(M) , n个 = 1 M(M) , N个 t吨 1 ( z(z) , z(z) + d日 z(z) ) ( 重新 ( u个 ^ k个 ( t吨 n个 ) ( ) ) ; 自动 - 相关性 功能 : ACF公司 k个 ( τ ) = 电子 [ 重新 u个 ^ k个 ( t吨 + τ ) 重新 u个 ^ k个 ( t吨 ) ] 1 N个 t吨 M(M) , n个 = 1 M(M) , N个 t吨 重新 ( u个 ^ k个 ( t吨 n个 + τ ) ( ) ) 重新 ( u个 ^ k个 ( t吨 n个 ) ( ) ) ;
    对于 k个 = 1 , , K(K) .
  • 估计值的一致性。如果模型是完美的,并且数据要么是独立的轨迹,要么是来自遍历测度的长轨迹,则估计值应随着数据大小的增加而收敛(参见例如[45,48]). 虽然我们的参数模型可能并不完美,但随着数据量的增加,估计量的波动性也会降低,因此该算法是稳健的,可以从不同的数据集生成类似的简化模型。
  • 简单和稀疏。当有多个简化模型执行类似操作时,我们更喜欢最简单的模型。我们通过LASSO(最小绝对收缩和选择算子)回归去除冗余项并增强稀疏性[49]. 特别是奇异正规矩阵(22)表示术语的冗余以及删除强相关术语的需要。
这些标准并非详尽无遗。其他方法包括贝叶斯信息准则(BIC,参见,例如[50]),以及误差降低率[51]可能适用,但根据我们的经验,它们对选择简化模型提供的帮助有限[7,14,46].
鉴于中高维非线性流图的统计学习(8)每一个线性内参数简化模型都提供了对所提出项所跨越的假设空间中的流图的最佳逼近。未来一个可能的方向是以非参数的方式选择自适应数据假设空间[23]并分析流图和假设空间之间的距离[52,53].

4.时空缩减的数值研究

我们检验了随机Burgers方程的NAR模型的推理和性能(1)和(2). 我们将考虑完整模型的两种设置:随机力的比例为 σ = 1 σ = 0.2 表示随机力分别支配或从属于动力学。我们还将考虑两种简化设置:简化模型的傅里叶模式数为 K(K) > K(K) 0 K(K) < K(K) 0 ,分别表示确定性响应的减少和随机力的减少。

4.1. 设置

如中所述第2.2节,我们对方程进行积分(4)第页,共页 2 N个 ETD-RK4的傅里叶模式,带时间步进 d日 t吨 解决方案得到准确解决。我们将此离散系统称为完整模型,其配置在表3。我们将考虑随机力的两种不同尺度,以及标准偏差 σ = 1 导致由随机力控制的动力学,以及 σ = 0.2 代表由确定性漂移控制的动力学。
我们在中生成数据(19)从中描述的完整模型第3.3节。我们通过首先对系统进行积分来生成初始条件的集合 10 4 初始条件的时间单位 u个 0 ( x个 ) = ( x个 ) + 2 余弦 ( x个 ) 然后画 10 从这个长轨迹均匀采样。然后,我们从随机选取的初始条件开始生成一条长轨迹或一组轨迹,并使用时间步进保存数据 δ 数值试验表明,从不同的初始条件生成数据时,不变密度和相关函数变化不大。
然后,我们推断第一种情况的NAR模型K(K)具有时间步长的傅里叶模式 δ 。我们将考虑以下两个值K(K)(回忆一下 K(K) 0 是随机力中的傅里叶模式数)
  • K(K) = 8 > K(K) 0 = 4 在这种情况下, (f) = 0 即,随机力不作用于未解析的傅里叶模式w个在(7)中,所以w个是解析傅立叶模式历史的确定函数。鉴于(14b),简化模型主要量化了这一确定性映射。我们称这种情况为“确定性响应的减少”,并在第4.3节.
  • K(K) = 2 < K(K) 0 在这种情况下, (f) 0 、和w个(7)取决于随机力的未观察到的傅里叶模式。因此,简化模型必须量化解和随机力的未解析傅里叶模式的影响。我们将这种情况称为“包含未解决随机力的归约”,并将结果表示为第4.4节.
无论哪种情况,我们都通过测试时间步长来探索NAR模型可以达到的最大时间步长 δ = d日 t吨 × { 5 , 10 , 20 , 30 , 40 , 50 , 80 , 160 } .
我们总结了中的配置和符号表3.

4.2. 型号选择和内存长度

我们演示了具有时间步长的简化模型的模型选择和记忆长度的影响 δ = 5 d日 t吨 我们的目标是为不同的设置选择NAR模型的通用参数形式 ( K(K) , σ ) ,其中 K(K) { 8 , 2 } 是NAR模型中的傅里叶模式数,以及 σ { 1 , 0.2 } 是完整模型随机力的标准偏差。在接下来的章节中,这种参数形式将用于探索NAR模型的最大时间缩减。
我们根据以下条件选择模型第3.4节:每对 ( K(K) , σ ) ,我们测试了一组NAR模型,并选择了最简单的模型,该模型能够最好地再现统计数据并具有一致的估计值。统计数据是沿着以下长轨迹计算的 T型 = 2000 时间单位。我们说,如果NAR爆炸(例如。, | u个 n个 | 超过 10 5 )到达之前 T型 = 2000 时间单位。
我们估计(17b)中的系数有几个时滞第页s.数值试验表明,当随机力为 (f) k个 n个 负极 j个 出现或延迟 u个 k个 n个 负极 j个 R(右) δ ( u个 n个 负极 j个 ) 大于2。因此,为了简单起见,我们通过设置以下内容来删除它们:
c(c) k个 , j个 (f) = 0 对于 全部的 1 j个 第页 , c(c) k个 , j个 v(v) = c(c) k个 , j个 R(右) = 0 对于 全部的 1 < j个 第页 ,
仅估计 c(c) k个 , 1 v(v) , c(c) k个 , 1 R(右) , c(c) k个 , j个 w个 对于 1 j个 第页 .
即(17b)中的术语 u个 k个 n个 负极 j个 R(右) δ ( u个 n个 负极 j个 ) 具有时滞1,即随机力项 (f) k个 n个 负极 j个 被删除,并且只有高阶(第四)项具有时滞第页。内存长度为 第页 δ .
内存长度。为了选择记忆长度,我们用时滞测试NAR模型 第页 { 1 , 5 , 10 , 20 } 并考虑它们在(23).图1显示了这些NAR模型的能量谱相对误差。它表明,作为第页增加:(1)当随机力的规模较大时( σ = 1 ),误差振荡无明显模式;(2) 何时 σ = 0.2 ,误差先减小后增大。因此,当随机力主导动力学时,较长的记忆不一定会导致更好的简化模型;但当确定性流主导动力学时,适当的记忆可能会有所帮助。
在所有四种设置中,最简单的NAR模型 第页 = 1 能连续再现能谱,相对误差在5%以内。值得注意的是,当真实的能量谱处于 10 负极 2 对于具有的模式 k个 = 7 , 8 在里面图2a、 b和 k个 = 2 在里面图2d。图2还显示了截断的K(K)-由于缺乏高模的快速能量耗散,模式Galerkin系统无法在任何这些设置中重现真实的能量谱,且尾部向上。因此,NAR模型通过 Φ n个 .
估计值的一致性。NAR模型的估计值随着数据量的增加趋于收敛。图3表明NAR的估计系数 第页 = 1 来自包含以下内容的数据M(M)轨迹,每个都有长度T型,其中 M(M) { 2 , 8 , 32 , 128 , 512 } T型 { 40 , 80 , 160 , 320 , 640 , 1280 } .作为 T型 × M(M) 增加,所有估计值趋于收敛(注意系数 c(c) k个 , 1 w个 规模为 10 负极 4 10 负极 ). 特别是,当 σ = 1 比什么时候 σ = 0.2 :(a)-(c)中的估计在 T型 × M(M) > 10 ,表明不同的轨迹导致相似的估计值,而估计值(取 c(c) K(K) , 1 R(右) 例如,在(b)–(d)中振荡,直到 T型 × M(M) > 10 5 这与更大的随机力使系统混合更快的事实相一致,因此每个轨迹都提供了更有效的样本,驱动估计器更快地收敛。
数值试验还表明,NAR模型在数值上可能不稳定,而其系数估计值是一致的(即,趋向于如上所述的收敛)。因此,一致性不足以选择NAR模型。
在我们的测试中,稀疏回归算法,如LASSO(参见示例[49])或顺序阈值(参见例如[54,55])很难进行适当的阈值分割,因为系数 c(c) w个 的高阶项很小,并且在不同的设置下可以在不同的尺度上变化,但这些高阶项对NAR模型很重要。
自NAR车型 第页 = 1 在所有四种设置中都表现良好,因为它们是最简单的,所以我们在接下来的部分中使用它们来探索最大的时间减少。

4.3. 确定性响应的减少

我们将在本节和下一节中探讨最大时间步长 δ NAR模型可以达到的。我们只考虑最简单的时滞模型 第页 = 1 .
我们首先考虑模型 K(K) = 8 傅里叶模式。由于随机力仅直接作用于第一个 K(K) 0 = 4 傅里叶模式,未解析变量w个英寸(12)是路径的确定函数K(K)模式,截断误差也是 P(P) B类 ( v(v) + w个 ) 负极 P(P) B类 ( v(v) ) 在(14b)中。因此,NAR模型主要减少了已解析变量对未解析变量的确定性响应。特别是,术语 Φ n个 在NAR模型(17a)中,在由(17b)中的项线性跨越的函数空间上,最佳地近似此确定性响应。
我们考虑时间步骤 δ = d日 t吨 × 间隙 具有 间隙 { 5 , 10 , 20 , 30 , 40 , 50 } 对于每个 δ ,我们首先估计系数 ( c(c) k个 , 1 v(v) , c(c) k个 , 1 R(右) , c(c) k个 , 1 w个 ) 从具有相同时间步长的数据中获得的NAR模型。然后,我们通过统计数据验证了估计的NAR模型。
数值试验表明,NAR模型具有 间隙 20 对于设置而言,数值不稳定 ( K(K) = 8 , σ = 1 ) ,号码是 间隙 = 50 用于设置 ( K(K) = 8 , σ = 0.2 ) .图4a、 b显示了NAR模型用这些稳定时间步长再现的能谱的相对误差。相对误差随着 间隙 增加。注意,模式的相对误差 k个 = 1 , 2 变化不大,但那些 k个 { , 4 , 5 , 6 } 显著增加。特别要注意,在(b)中 k个 = 8 约为8% 间隙 { 20 , 30 , 40 } ,但相对误差为 k个 { , 4 , 5 , 6 } 急剧增加,在 k个 = 6 什么时候 间隙 = 40 。我们将在第4.5节.
这些NAR模型相对准确地再现了PDF和ACF。图5显示了模式实部的边际PDF。顶行显示了NAR模型的边际PDF 间隙 = 5 与全模型和Galerkin截断系统(用时间步长求解 d日 t吨 ). 对于具有波数的模式 k个 { 1 , 2 , , 4 } ,NAR模型几乎完美地捕捉了PDF的形状和扩展,改进了Galerkin截断系统的形状和扩展。对于具有的模式 k个 { 5 , 6 , 7 , 8 } ,NAR模型仍然表现良好,显著改进了截断Galerkin系统的性能。随着波数的增加,PDF之间的差异变得更大,因为这些模式受未解析模式的影响更大。底部一行显示,Kolmogorov–Smirnov统计数据(累积分布函数之间的最大差异)随着 间隙 增加。图6显示了ACF。最上面一行显示,NAR模型( 间隙 = 5 )并且Galerkin系统可以精确地再现ACF。底部一行显示ACF的相对误差,单位为 L(左) 2 ( [ 0 , ] ) -正常,增加为 间隙 增加(尤其是在这种情况下 σ = 0.2 ). 回想一下,截断的Galerkin系统生成的PDF支持范围比高模式的真相要广得多(请参阅图5),还有那个 R(右) δ 随着 δ 增加。因此,术语u个 R(右) δ ( u个 ) 在NAR模型(17)中,保持时间相关性,高阶项有助于耗散能量并保持不变测度。
总之,当 K(K) = 8 ,最大时间步长为 δ d日 t吨 × [ 10 , 20 ) = [ 0.01 , 0.02 ) δ = d日 t吨 × [ 40 , 50 ) = [ 0.04 , 0.05 ) 什么时候 σ = 1 σ = 0.2 分别适用于具有 第页 = 1 所有这些NAR模型都能准确地再现能量谱、不变测度和时间自相关。

4.4. 包含未求解随机力的约简

我们考虑下一个NAR模型 K(K) = 2 。在这种情况下,未解析变量w个英寸(12)是两个路径的函数K(K)模式和未解决的随机力。因此,鉴于(14b)(16)和(17),NAR模型量化了K(K)-模式转换为未解析傅里叶模式和未解析随机力。
首先要注意 K(K) = 2 对于K(K)-模式Galerkin系统有意义地再现任何统计或动力学特性;看见图2c、 d表示能量谱,图5c、 d表示边际PDF和图6c、 d用于ACF。相反,NAR模型 δ = 5 d日 t吨 ,其任期 R(右) δ 来自K(K)-mode Galerkin,准确再现这些统计数据。值得注意的是,即使时间步长大到 δ = 80 d日 t吨 ,K-S统计值小于 0.025 在里面图5c、 d,ACF的相对误差小于6%in图6c、 d。
为了探索NAR模型可以达到的最大时间步长,我们考虑了时间步长 δ = d日 t吨 × 间隙 具有 间隙 { 5 , 10 , 20 , 40 , 80 , 160 } 数值试验表明,NAR模型在两种设置下都是数值稳定的 σ = 1 σ = 0.2 .图4c、 d显示了NAR模型用这些时间步长再现的能谱的相对误差。相对误差先减小,然后增大 间隙 增加,当 间隙 = 10 间隙 = 20 用于设置 σ = 1 σ = 0.2 分别是。特别是,所有这些相对误差都小于9%,除非 间隙 = 160 在设置中 σ = 1 .
总之,当 K(K) = 2 ,NAR模型可以容忍较大的时间步长。最大时间步长至少为 δ = d日 t吨 × 80 = 0.08 δ d日 t吨 × 160 = 0.16 什么时候 σ = 1 σ = 0.2 分别用于NAR模型再现能量谱,相对误差小于9%。

4.5. 关于时空缩减的讨论

由于模型约简的目的是时空约简,所以自然要考虑时空中的最大约简;换句话说,最小“空间”维度K(K)和最大时间步长 δ = d日 t吨 × 间隙 。我们从前面的章节中获得了以下观察结果:
  • 空间降维、降维模型的记忆长度与随机力密切相关。正如随机动力学的离散Mori–Zwanzig形式主义所建议的那样(参见例如[7])空间降维将导致非马尔可夫闭包模型。图1这表明适当的中等记忆长度可以产生最佳的NAR模型。这也表明,白时间随机力的尺度会影响记忆长度,而随机力的规模越大,记忆越短。我们将继续研究记忆长度(时间上为彩色或白色)、随机力和能量耗散之间的关系。
  • 最大时间步长取决于随机力的空间维数和规模,主要受限于非线性简化模型的稳定性。图4显示了当 K(K) = 2 至少是 δ = d日 t吨 × 间隙 具有 间隙 = 160 ,比 K(K) = 8 它还表明,随着随机力的规模从 σ = 0.2 σ = 1 NAR模型的最大时间步长减小(因为NAR模型要么变得不稳定,要么在能量谱上有较大误差)。值得注意的是,NAR模型的这些最大时间步长小于K(K)-Galerkin系统可以容忍的模式。图7表明K(K)-模式Galerkin系统可以在比NAR模型大得多的时间步长下稳定:K模式Galergin系统的最大时间步长是当平均CFL数(线性增加)达到1时,但NAR模型稳定的最大时间步较小。例如,在设置中 ( K(K) = 8 , σ = 0.2 ) ,Galerkin系统的最大时间间隔为 间隙 = 80 (红色菱形线的末端),但NAR模型的最大时间间隔约为 间隙 = 10 。NAR模型的数值不稳定性增加可能是由于非线性项 Φ n个 这对于NAR模型保持能量耗散和能量谱很重要(参见图2和中的系数图3).
除了最大简化之外,还有一个有趣的问题:简化后的模型何时表现最佳(即,能量谱中的相对误差最小)?我们称之为时空约简的最优化。与时空中的最大缩减相比,它与模型缩减更为有趣和相关,因为可以以NAR模型中的大误差为代价实现大时间步长或小空间维度,正如我们在图4。我们注意到图4c、 当 间隙 s是最接近中的方块图7,其中完整模型的平均CFL数与K(K)-模式Galerkin系统。我们推测,当K(K)-模式Galerkin系统保留了完整模型的CFL数。

5.结论

我们考虑随机Burgers方程的数据驱动模型约简,将其作为一个统计学习问题来逼近低波数傅里叶模式的流图。基于将高阶模态表示为求解变量轨迹的泛函,我们导出了一类有效的参数化约化闭包模型。简化模型为非线性自回归(NAR)时间序列模型,系数由最小二乘法估计。在各种设置下,NAR模型可以准确地再现能量谱、不变密度和自相关等统计信息。
使用最简单的NAR模型,我们研究了四种情况下的最大时空缩减:确定性响应的缩减( K(K) > K(K) 0 )vs.涉及未解决随机力的简化( K(K) < K(K) 0 )以及小规模与大规模随机力( σ = 0.2 σ = 1 ),其中 K(K) 0 是白时随机力的傅里叶模式数,以及 σ 是力的大小。空间维度的缩减是无限的,NAR模型具有 K(K) = 2 傅里叶模式可以再现能量谱,相对误差小于5%。时间缩短是另一回事。最大时间缩减取决于维数缩减和随机力的规模,因为它们会影响NAR模型的稳定性。NAR模型的稳定性限制了最大时间步长小于K型Galerkin系统的最大时间步宽。数值试验表明,NAR模型在K型Galerkin系统的平均CFL数与全模型一致的时间步长上达到最小的相对误差。这是最佳时空缩减的潜在标准。
NAR模型结构的简单性为进一步理解数据驱动的模型简化开辟了多个前沿。未来的方向包括:(1)研究最优时空约简、CFL数和约简模型精度量化之间的关系;(2) 研究系统的记忆长度、降维、随机力和能量耗散之间的关系;(3) 开发后处理技术,以有效恢复高傅里叶模式的信息,从而使用简化模型预测冲击。

基金

本研究由NSF-1913243和NSF-1821211资助。

致谢

作者想感谢匿名审稿人提供的宝贵反馈,这些反馈大大改进了手稿。他很感激亚历山大·乔林提出这个问题。这项研究是我们重整化群方法联合项目的一部分。作者要感谢Kevin Lin、Panos Stinis、John Harlim、Xiantao Li、Mauro Maggioni和Felix Ye的有益讨论。

利益冲突

作者声明没有利益冲突。

缩写

本手稿中使用了以下缩写:
ETDRK4公司指数时间差分四阶Rouge–Kutta方法
CFL编号Courant–Friedrichs–路易号码
NAR公司非线性自回归
PDF格式概率密度函数
ACF公司自相关函数

工具书类

  1. Stinis,P.Mori Zwanzig不确定性量化的简化模型II:初始条件不确定性。arXiv公司 2012,arXiv:1212.6360。[谷歌学者]
  2. Li,Z。;卞,X。;李,X。;Karniadakis,G.E.通过Mori-Zwanzig形式主义将记忆效应纳入粗训练建模。化学杂志。物理学。 2015,143, 243128. [谷歌学者] [交叉参考] [公共医学]
  3. Lu,F。;涂,X。;Chorin,A.J.通过随机参数化解释集合卡尔曼滤波器中未解尺度的模型误差。周一。天气。修订版。 2017,145, 3709–3723. [谷歌学者] [交叉参考]
  4. Lu,F。;韦策尔,N。;Monahan,A.基于稀疏噪声数据的非线性随机能量平衡模型的联合状态参数估计。非线性过程。地球物理学。 2019,26, 227–250. [谷歌学者] [交叉参考] [绿色版本]
  5. 茨万齐格,R。非平衡统计力学; 牛津大学出版社:美国纽约州纽约市,2001年。[谷歌学者]
  6. Chorin,A.J。;O.H.哈尔德。数学和科学中的随机工具第3版。;施普林格:美国纽约州纽约市,2013年。[谷歌学者]
  7. Lin,K.K。;Lu,F.数据驱动模型简化、Wiener投影和Koopman-Mori-Zwanzig形式主义。J.计算。物理学。 2020,424, 109864. [谷歌学者] [交叉参考]
  8. Kondrashov,D。;医学博士Chekroun。;Ghil,M.数据驱动的非马尔可夫封闭模型。物理D 2015,297, 33–55. [谷歌学者] [交叉参考] [绿色版本]
  9. 哈里姆·J。;Li,X.非线性薛定谔方程的参数化简化模型。物理学。版本E 2015,91,053306。[谷歌学者] [交叉参考] [绿色版本]
  10. Lei,H。;贝克,N.A。;Li,X.广义Langevin方程的数据驱动参数化。程序。国家。阿卡德。科学。美国 2016,113, 14183–14188. [谷歌学者] [交叉参考] [绿色版本]
  11. 谢,X。;Mohebujjaman,M。;雷霍尔茨,L.G。;伊利埃斯库,T.数据驱动流体流动的过滤降阶模型。SIAM J.科学。计算。 2018,40,B834–B857。[谷歌学者] [交叉参考] [绿色版本]
  12. 医学博士Chekroun。;Kondrashov,D.数据自适应谐波谱和多层Stuart-Landau模型。混沌间盘。非线性科学杂志。 2017,27, 093110. [谷歌学者] [交叉参考] [绿色版本]
  13. Chorin,A.J。;Lu,F.非线性动力学中随机参数化和降维的离散方法。程序。国家。阿卡德。科学。美国 2015,112, 9804–9809. [谷歌学者] [交叉参考] [绿色版本]
  14. Lu,F。;Lin,K.K。;Chorin,A.J.基于数据的Kuramoto–Sivashinsky方程随机模型简化。物理D 2017,340, 46–57. [谷歌学者] [交叉参考] [绿色版本]
  15. Pathak,J。;亨特,B。;Girvan,M。;卢,Z。;Ott,E.《基于数据的大型时空混沌系统的无模型预测:水库计算方法》。物理学。修订稿。 2018,120, 024102. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  16. 马,C。;Wang,J。;E、 动态系统的记忆模型简化和机器学习。Commun公司。计算。物理学。 2018,25, 947–962. [谷歌学者] [交叉参考]
  17. 哈里姆·J。;Jiang,S.W。;Liang,S。;Yang,H.缺失动力学预测的机器学习。J.计算。物理学。 2020. [谷歌学者] [交叉参考]
  18. E.J.帕里什。;Duraisamy,K.,《使用场反演和机器学习的数据驱动预测建模范式》。J.计算。物理学。 2016,305,758–774,工程师。[谷歌学者] [交叉参考] [绿色版本]
  19. Duan,J。;魏伟(Wei,W.)。随机偏微分方程的有效动力学; 爱思唯尔出版社:荷兰阿姆斯特丹,2014年。[谷歌学者]
  20. Stinis,P.无尺度分离系统的重整化Mori-Zwanzig-简化模型。程序。R.Soc.A公司 2015,471, 20140446. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  21. 哈德逊,T。;Li,X.H.通过Mori-Zwanzig形式主义对过阻尼Langevin动力学进行粗训练。多尺度模型。模拟。 2020,18, 1113–1135. [谷歌学者] [交叉参考]
  22. Choi,Y。;Carlberg,K.非线性模型简化的时空最小二乘Petrov-Galerkin投影。SIAM J.科学。计算。 2019,41,A26–A58。[谷歌学者] [交叉参考]
  23. Jiang,S.W。;Harlim,J.缺失动力系统建模:使用非参数框架推导参数模型。Res.数学。科学。 2020,7, 1–25. [谷歌学者] [交叉参考]
  24. 马里恩,M。;Temam,R.非线性Galerkin方法。SIAM J.数字。分析。 1989,26, 1139–1157. [谷歌学者] [交叉参考]
  25. 医学博士Jolly。;Kevrekidis,I.G.公司。;Titi,E.S.Kuramoto-Sivashinsky方程的近似惯性流形:分析和计算。物理D 1990,44, 38–60. [谷歌学者] [交叉参考]
  26. Rosa,R.指数阶近似惯性流形。离散连续。发电机。系统。 1995,, 421–448. [谷歌学者] [交叉参考]
  27. Novo,J。;Titi,E.S。;Wynne,S.使用高精度近似惯性流形的高效方法。数字。数学。 2001,87, 523–554. [谷歌学者] [交叉参考]
  28. Zelik,S.耗散偏微分方程的惯性流形和有限维约化。程序。R.Soc.爱丁堡。A类 2014,144, 1245–1327. [谷歌学者] [交叉参考] [绿色版本]
  29. 张,H。;哈里姆·J。;Li,X.使用基于正交多项式的估计量计算线性响应统计:RKHS公式。arXiv公司 2019,arXiv:1912.11110。[谷歌学者]
  30. 潘,S。;Duraisamy,K。封闭模型的数据驱动发现。SIAM J.应用。动态。系统。 2018,17, 2381–2413. [谷歌学者] [交叉参考]
  31. E、 W。;Khanin,K。;马泽尔,A。;Sinai,Y.G.具有随机强迫的Burgers方程的不变测度。安。数学。 2000,151, 877–960. [谷歌学者] [交叉参考]
  32. Chorin,A.J.Korteveg-deVries-Burgers方程的平均化和重正化。程序。国家。阿卡德。科学。美国 2003,100, 9674–9679. [谷歌学者] [交叉参考] [绿色版本]
  33. Chorin,A.J。;Hald,O.H.Burgers和Korteweg-deVries-Burgers方程的粘度相关惯性谱。程序。国家。阿卡德。科学。美国 2005,102, 3921–3923. [谷歌学者] [交叉参考] [绿色版本]
  34. 贝克·J。;Khanin,K.Burgers湍流。物理学。代表。 2007,447, 1–66. [谷歌学者] [交叉参考]
  35. 贝克,M。;Wayne,C.E.使用全局不变流形理解小粘度Burgers方程的亚稳定性。SIAM J.应用。动态。系统。 2009,8, 1043–1065. [谷歌学者] [交叉参考] [绿色版本]
  36. Wang,Z。;阿赫塔,I。;Borggaard,J。;Iliescu,T.正确正交分解非线性闭包模型的两层离散化。J.计算。物理学。 2011,230, 126–146. [谷歌学者] [交叉参考]
  37. 多拉普奇耶夫,S。;阿查兹,美国。;Timofeyev,I.强迫Burgers方程有限差分离散化中局部平均值的随机闭包。西奥。计算。流体动力学。 2013,27,297–317页。[谷歌学者] [交叉参考]
  38. 本纳,P。;古吉丁,S。;Willcox,K.参数动力系统基于投影的模型简化方法综述。SIAM修订版。 2015,57, 483–531. [谷歌学者] [交叉参考]
  39. Quarteroni,A。;Manzoni,A。;F.内格里。偏微分方程的约化基方法:简介; 施普林格:德国柏林/海德堡,2015年;第92卷。[谷歌学者]
  40. Sinai,Y.G.关于带力Burgers方程解的渐近行为的两个结果。《统计物理学杂志》。 1991,64, 1–12. [谷歌学者] [交叉参考]
  41. 达普拉托,G。无限维分析导论; 施普林格科技与商业媒体:德国柏林/海德堡,2006年。[谷歌学者]
  42. 考克斯,S.M。;Matthews,P.C.刚性系统的指数时间差分。J.计算。物理学。 2002,176, 430–455. [谷歌学者] [交叉参考] [绿色版本]
  43. 卡萨姆,A.K。;Trefethen,法律公告僵硬PDE的四阶时间步进。SIAM J.科学。计算。 2005,26, 1214–1233. [谷歌学者] [交叉参考]
  44. Gottlieb,D。;Orszag,S。谱方法的数值分析:理论与应用; SIAM:美国宾夕法尼亚州费城,1977年。[谷歌学者]
  45. 范,J。;Q·姚。非线性时间序列:非参数和参数方法; 施普林格:美国纽约州纽约市,2003年。[谷歌学者]
  46. Lu,F。;Lin,K.K。;Chorin,A.J.亚椭圆系统连续和离散时间基于数据建模的比较。Commun公司。申请。数学。计算。科学。 2016,11, 187–216. [谷歌学者] [交叉参考] [绿色版本]
  47. 北卡罗来纳州维尔胡尔。;Crommelin,D.VARX过程的随机参数化。arXiv公司 2020,arXiv:stat.ME/2010.03293。[谷歌学者]
  48. Y.A.库托扬茨。遍历扩散过程的统计推断; 施普林格:德国柏林/海德堡,2004年。[谷歌学者]
  49. Tibshirani,R.通过套索回归收缩和选择。J.R.统计社会服务。(Methodol.) 1996,58,第267页至第288页。[谷歌学者] [交叉参考]
  50. 布罗克韦尔,P。;R·戴维斯。时间序列和预测简介; 施普林格:美国纽约州纽约市,2002年。[谷歌学者]
  51. Billings,S.A.公司。非线性系统辨识:时间、频率和时空域的NARMAX方法; 约翰·威利父子:美国新泽西州霍博肯,2013年。[谷歌学者]
  52. Györfi,L。;科勒,M。;Krzyzak,A。;Walk,H。非参数回归的无分布理论; 施普林格科技与商业媒体:德国柏林/海德堡,2006年。[谷歌学者]
  53. Lu,F。;钟,M。;唐,S。;Maggioni,M.从轨迹数据对主体系统中相互作用定律的非参数推断。程序。国家。阿卡德。科学。美国 2019,116, 14424–14433. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  54. She,Y.基于阈值的模型选择和收缩迭代选择程序。电子。J.统计。 2009,, 384–415. [谷歌学者] [交叉参考]
  55. 奎德,M。;阿贝尔,M。;新泽西州库茨。;Brunton,S.L.快速恢复模型的非线性动力学稀疏辨识。混乱 2018,28, 063116. [谷歌学者] [交叉参考] [公共医学]
图1。不同记忆长度的NAR模型再现的能谱相对误差第页,在以下四种设置中 ( K(K) , σ ) .由于时间滞后第页相对误差往往先减小后增大,特别是在(b条,d日)带有 σ = 0.2 .
图1。具有不同存储长度的NAR模型再现的能谱的相对误差第页,在以下四种设置中 ( K(K) , σ ) .由于时间滞后第页相对误差往往先减小后增大,特别是在(b条,d日)带有 σ = 0.2 .
熵22 01360 g001
图2。NAR模型的能谱 第页 = 1 K(K)-四种设置下的模式伽辽金系统 ( K(K) , σ ) 。时间步长为 δ = 5 d日 t吨 对于NAR车型 d日 t吨 用于Galerkin模型。NAR模型准确地再现了所有设置下的真实能量谱。
图2。具有的NAR模型的能量谱 第页 = 1 K(K)-模式Galerkin系统的四种设置 ( K(K) , σ ) 。时间步长为 δ = 5 d日 t吨 对于NAR车型 d日 t吨 用于Galerkin模型。NAR模型准确地再现了所有设置下的真实能量谱。
熵22 01360 g002
图3。估计系数 ( c(c) k个 , 1 v(v) , c(c) k个 , 1 R(右) , c(c) k个 , j个 w个 ) 在NAR车型中 第页 = 1 δ = 5 d日 t吨 在以下四种设置中 ( K(K) , σ ) 估计值趋向于随着轨迹长度快速收敛T型和编号M(M)增加:注意系数 c(c) k个 , 1 w个 规模为 10 负极 4 10 负极 .
图3。估计系数 ( c(c) k个 , 1 v(v) , c(c) k个 , 1 R(右) , c(c) k个 , j个 w个 ) 在NAR车型中 第页 = 1 δ = 5 d日 t吨 在以下四种设置中 ( K(K) , σ ) 估计值趋向于随着轨迹长度快速收敛T型和编号M(M)增加:注意系数 c(c) k个 , 1 w个 规模为 10 负极 4 10 负极 .
熵22 01360 g003
图4。具有时间步长的NAR模型再现的能谱相对误差 δ = d日 t吨 × 间隙 对于 间隙 { 5 , 10 , 20 , 30 , 40 , 50 } 在的四个设置中 ( K(K) , σ ) .所有NAR模型都具有时滞 第页 = 1 .失踪人员 间隙 中的(,b条)导致数值不稳定的NAR模型。因此,最大值 δ NAR模型可以达到的目标是 δ [ 0.01 , 0.02 ) δ [ 0.04 , 0.05 ) 的(,b条)分别,以及 δ 0.16 的(c(c),d日).
图4。具有时间步长的NAR模型再现的能谱中的相对误差 δ = d日 t吨 × 间隙 对于 间隙 { 5 , 10 , 20 , 30 , 40 , 50 } 在以下四种设置中 ( K(K) , σ ) .所有NAR模型都具有时滞 第页 = 1 .失踪人员 间隙 中的(,b条)导致数值不稳定的NAR模型。因此,最大值 δ NAR模型可以达到的目标是 δ [ 0.01 , 0.02 ) δ [ 0.04 , 0.05 ) 的(,b条)分别是,和 δ 0.16 的(c(c),d日).
熵22 01360 g004
图5。边际PDF和K-S统计(Kolmogorov——Smirnov统计,这是累积分布函数之间的最大差异)。在每个(d日),顶部面板是傅里叶模式实部的经验边际PDF图,来自数据(True)、K模式Galerkin系统(Galerklin)和具有 第页 = 1 δ = 间隙 d日 t吨 间隙=5;底部面板是具有不同时间步长的NAR模型的K-S统计 δ = d日 t吨 × 间隙 达到最大间隙,从而NAR模型在数值上稳定。
图5。边际PDF和K-S统计(Kolmogorov——Smirnov统计,这是累积分布函数之间的最大差异)。在每个(d日),顶部面板是傅里叶模式实部的经验边际PDF图,来自数据(True)、K模式Galerkin系统(Galerklin)和具有 第页 = 1 δ = 间隙 d日 t吨 间隙=5;底部面板是具有不同时间步长的NAR模型的K-S统计 δ = d日 t吨 × 间隙 达到最大间隙,从而NAR模型在数值上稳定。
熵22 01360 g005
图6。ACF(自相关函数。在每个(d日),当Gap=5时,顶部面板是傅立叶模式的实部的ACF;底部面板是相对误差(in L(左) 2 ( [ 0 , ] ) -范数)不同时间步长的NAR模型 δ = d日 t吨 × 间隙 达到最大间隙,从而NAR模型在数值上稳定。
图6。ACF(自动相关功能(d日),顶部面板是Gap=5时傅里叶模式实部的ACF;底部面板是相对误差(in L(左) 2 ( [ 0 , ] ) -范数)不同时间步长的NAR模型 δ = d日 t吨 × 间隙 达到最大间隙,从而NAR模型在数值上稳定。
熵22 01360 g006
图7。完整模型和K(K)-模式伽辽金系统。平均CFL数是沿着具有 10 5 步骤。时间步长为 d日 t吨 = 0.001 对于完整模型,是 δ = d日 t吨 × 间隙 对于K(K)-模式Galerkin系统。什么时候? ( σ = 1 , K(K) = 8 ) ,的K(K)-模式Galerkin系统在 间隙 > 80 ,因此其CFL编号随后丢失。星星是最大的 间隙 ,因此NAR模型是稳定的。红色和蓝色方块表示完整模型的平均CFL数与K(K)-模式Galerkin系统。恒星(∏)是NAR模型数值稳定的最大时间间隔。能量谱的相对误差图4c、 当 间隙 的是最接近这些方块的。
图7。全模型的平均CFL数和K(K)-模式Galerkin系统。沿轨迹计算平均CFL数 10 5 步骤。时间步长为 d日 t吨 = 0.001 对于完整模型,是 δ = d日 t吨 × 间隙 对于K(K)-模式Galerkin系统。什么时候? ( σ = 1 , K(K) = 8 ) ,的K(K)-模式Galerkin系统在 间隙 > 80 ,因此其CFL编号随后丢失。星星是最大的 间隙 ,因此NAR模型是稳定的。红色和蓝色方块表示完整模型的平均CFL数与K(K)-模式Galerkin系统。恒星(∏)是NAR模型数值稳定的最大时间间隔。能量谱中的相对误差图4c、 当 间隙 的是最接近这些方块的。
熵22 01360 g007
表1。注释:完整模型和简化模型中的变量。
表1。注释:完整模型和简化模型中的变量。
模型符号描述
完整模型 u个 ( x个 , t吨 ) = | k个 | 1 u个 ^ k个 ( t吨 ) 电子 q个 k个 x个 的解决方案(1)在其傅立叶级数中
(f) ( x个 , t吨 ) = | k个 | 1 K(K) 0 (f) ^ k个 ( t吨 ) 电子 q个 k个 x个 随机力(2)在其傅里叶级数中
v(v) ( x个 , t吨 ) = | k个 | K(K) u个 ^ k个 ( t吨 ) 电子 q个 k个 x个 解析变量,闭包建模的目标过程
w个 ( x个 , t吨 ) = | k个 | > K(K) u个 ^ k个 ( t吨 ) 电子 q个 k个 x个 未解决变量; u个 = v(v) + w个 英寸(12)
ν , σ 粘度(1)以及随机力的强度
N个, d日 t吨 数值求解中的模态数和时间步长
简化模型K(K)(17)中简化(NAR)模型的模式数
( u个 k个 n个 ) | k个 | K(K) 简化模型中的状态变量,对应于 u个 ^ k个 ( t吨 n个 )
δ = d日 t吨 × 间隙 观测时间间隔
R(右) k个 δ , Φ n个 , n个 年NAR模型中的参数项(10)和(17)
表2。完整模型和简化模型之间变量的对应关系。
表2。完整模型和简化模型之间变量的对应关系。
中的完整模型(4)中的简化模型(10)或(17)
状态变量 u个 ^ k个 ( t吨 n个 ) u个 ^ ( t吨 n个 ) 英寸(4)和(9) u个 k个 n个 u个 n个 英寸(10)
已解析变量 v(v) ( x个 , t吨 n个 ) v(v),在(6)和(12)向量 ( u个 负极 K(K) n个 , , u个 K(K) n个 ) 英寸(17)
未解析变量 w个 ( x个 , t吨 ) w个(7)和(12)不适用
随机力白噪声 (f) ^ k个 ( t吨 n个 ) 英寸(9)白噪声 (f) k个 n个 英寸(10)
推理中引入的噪声不适用 n个 英寸(10)
解析变量的流程图F类在方程式中(8)方程式(10)
表3。完整和简化模型的设置。
表3。完整和简化模型的设置。
完整模型 ν = 0.02 , L(左) = 1 粘度,方程的区间长度
N个 = 128 , d日 t吨 = 0.001 模式数,时间步长
K(K) 0 = 4 随机力中的模态数
σ = 1 0.2 随机力的标准偏差
简化模型 K(K) = 8 2 简化模型中的模式数
δ = d日 t吨 × 间隙 观测时间间隔
间隙 { 5 , 10 , 20 , 30 , 40 , 50 , 80 , 160 } 时间步间距
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

卢,F。随机Burgers方程的数据驱动模型简化。 2020,22, 1360.https://doi.org/10.3390/e22121360

AMA风格

Lu F。随机Burgers方程的数据驱动模型简化。. 2020; 22(12):1360.https://doi.org/10.3390/e22121360

芝加哥/图拉宾风格

陆飞。2020年,“随机Burgers方程的数据驱动模型简化”22,第12期:1360。https://doi.org/10.3390/e22121360

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部