跳到主要内容

理论与现代应用

不确定MIMO二阶双曲分布参数系统的迭代学习控制

摘要

本文研究了一类具有不确定性的多输入多输出二阶双曲分布参数系统的迭代学习控制问题。针对状态存在初始偏差的分布式系统,在迭代过程中提出了一种P型迭代学习控制方案。在以下意义上,可以保证跟踪误差相对于迭代指数的收敛性\(\mathbf{L}^{2}\)规范。提出了差分迭代学习算法在理论上的可行性。数值仿真结果表明了该方法的有效性。

1介绍

ILC是一种针对有限间隔内重复过程和任务的智能控制方法。ILC最初由Arimoto用数学公式表示等。[1]. 在过去的三十年中,它一直在不断研究并广泛应用于各种工程实践,如机器人学、高速公路交通控制、生物医学工程、工业过程控制、,等等[29]. ILC的主要优点是完全跟踪包含不确定性或非线性的复杂系统的可行参考轨迹(或演化曲线)。只有根据输入和输出信号才能实现[1014]. 这是一种真正的无模型方法,其动机是人类在实践中的试错经验。

尽管ILC在有限维系统中得到了广泛的研究,但使用无限维框架进行时空过程相关的研究工作却很少,甚至更少[15]提出了一种用于拉伸运动弦边界控制的迭代学习算法,这是将ILC框架扩展到分布参数系统的先驱工作。张力控制系统研究于[16]通过使用PD型学习算法。基于算子半群理论的P型和D型迭代学习算法都是针对抛物型偏微分方程控制的一维分布参数系统设计的[17]并在中推广到一类脉冲一阶分布参数系统[18]. 在[19]针对单输入单输出非线性偏微分方程,提出了一种稳态迭代学习控制方案。将D型预测ILC格式应用于一类非均匀热方程的边界控制[20],其中一侧的热流是控制输入,而另一侧的温度测量是控制输出。通过将非均匀热方程转化为积分形式并利用嵌入雅可比θ函数的性质,保证了迭代学习算法的学习收敛性。在[21]为了应用方便,使用Crank-Nicholson离散化,为热方程设计了ILC,其中控制允许选择有限数量的点用于传感和驱动。最近,在中提出了非均匀分布参数系统的ILC频域设计和分析框架[22]. 然而,这些工作并没有涉及MIMO二阶双曲型分布参数系统。

双曲分布参数系统的控制问题在许多动力学过程中经常遇到,例如波的传播、流体动力学、弹性振动等。在[23]针对非等温管式反应器中出现的一阶双曲分布参数系统,利用一组常微分方程(ODE)进行模型逼近,提出了一种P型ILC算法。此外,ILC问题在[24]对于Hilbert空间中的一阶严格双曲分布参数系统,基于P型算法给出了收敛条件,并要求初始状态值相同。

本文研究一类具有不确定性的MIMO二阶双曲分布参数系统的ILC问题。介绍了一种P型迭代学习控制方案,并给出了跟踪误差收敛的一个充分条件\(\mathbf{L}^{2}\)给出了范数。该条件不需要解析解,只需要系统系数矩阵不确定性的界和适当的范数空间假设。所提出的控制方案是首次将其推广到具有容许初始状态误差的MIMO二阶双曲分布参数系统。另一方面,收敛分析比有限维系统更复杂,因为它涉及时间、空间和迭代域。我们没有将无限维系统简化为有限维系统,也没有用离散时间等价物替换它们(参见[23]). 只有在仿真中,为了说明所提出的迭代学习控制方法的有效性,我们使用了前向差分方法来离散无穷维系统。

符号

上标“T”表示矩阵转置;和0分别表示适当维数的单位矩阵和零矩阵。对于n个-维常数向量\({\mathbf{q}}=(q{1},q{2},\ldots,q{n})^{\mathrm{T}}\),其欧几里德范数定义为\({\mathbf{q}}\|=\sqrt{\sum{i=1}^{n} q个_{i} ^{2}}\).的频谱范数\(n次n次)-阶方阵A类定义为\(A\|=\sqrt{\lambda_{\mathrm{max}}(A^{\mathrm{T}}A)}\),其中\(\lambda_{\mathrm{max}}(\cdot)\)(\(\lambda_{\mathrm{min}}(\cdot)\))表示最大(最小)特征值。\({\mathbf{L}}^{2}(\Omega)\)是可测量函数的集合q个定义在有界域上\(\Omega\in\mathbf{R}^{m}\)这样的话\(\|q\|_{{\mathbf{L}}^{2}}^}=\int_{\Omega}|q(x)|^{2{,\mathrm{d} x个<\infty\).如果\(q_{i}(x)在{\mathbf{L}}^{2}(\Omega)中(\(i=1,2,\ldot,k))(为了方便起见,我们表示\({\mathbf{L}}^{2}(\Omega)\)作为\(\mathrm{L}^{2}(\Omega;\mathbf{R})\))然后我们写\({\mathbf{q}}(x)=(q{1}(x),\ldots,q{n}(z))在\mathbf{R}^{n}\cap{\mathbf{L}^{2}(\Omega)中、和\(\|{\mathbf{q}}\|_{{\mathbf{L}}^{2}}^}=\int_{\Omega}{\mat血红蛋白{q}{^{\mathrm{T}}(x){d} x个\)。对于\({\mathbf{w}}(x,t):\Omega\times[0,t]\rightarrow\mathbf{R}^{m}\)这样的话\({\mathbf{w}}(\cdot,t)\ in \mathbf{R}^{m}\cap{\mathbf{L}}^{2}(\欧米茄)\)\(在[0,t]\中),给定\(\lambda>0\),其\(({\mathbf{L}}^{2};\lambda)\)规范定义为

$$\Vert{\mathbf{w}}\Vert_{({\mathbf{L}}^{2};\lambda)}=\sup_{0\leqslate t\leqslide t}\bigl\{\bigl\ Vert{\ mathbf}w}}(\cdot,t)\bigr\Vert^{2}_{{\mathbf{L}}^{2}(\Omega)}e^{-\lambdat}\bigr\}$$

2ILC系统描述

我们考虑以下由偏微分方程控制的MIMO二阶双曲分布参数系统:

$$\left\{\textstyle\begin{array}{l}\frac{\partial^{2}{\mathbf{q}}(x,t)}{\paratil{t^{2{}}=D\三角形{\mathbf{q{}}{y}}(x,t)=C(t){\mathbf{q}}$$
(1)

哪里\((x,t)\ in \ Omega \ times[0,t]\)也就是说,x个t吨分别表示空间和时间变量,T型Ω是的有界开子集\(\mathbf{R}^{m}\)边界光滑Ω,\({\mathbf{q}}(\cdot,\cdot)\in\mathbf{R}^{n}\)\({\mathbf{u}}(\cdot,\cdot)\in\mathbf{R}^{u}\)、和\({\mathbf{y}}(\cdot,\cdot)\in\mathbf{R}^{y}\)分别是系统的状态向量、输入向量和输出向量,是有界正常对角矩阵,即,\(D=\operatorname{diag}\{D_{1},D_{2},\ldots,D_}\}\)\(0<p_{i}\leqslant d_{i}<\infty\)(\(i=1,2,\ldot,n)),以及\(p_{i}\)已知,\(三角形=\sum{i=1}^{m}{\frac{\partial^{2}}{\paratilx{i}^{2{}}\)是定义在Ω上的拉普拉斯算子,\(A(t)\)是所有元素的有界正定矩阵\(在[0,t]\中)、和\(B(t)\)\(C(t)\)、和\(G(t)\)是适当维数的有界时变不确定矩阵。

初始和边界条件(1)表示为

$$\begin{aligned}&{mathbf{q}}(x,t)=0,\quad(x,t)\in\partial\Omega\times[0,t],\end{alinged}$$
(2)
$$\begin{aligned}&{mathbf{q}}(x,0)=\varphi(x),\qquad\frac{\partial{\mathbf}(x,t)}{\particalt}\bigg|_{t=0}=\psi(x)。\结束{对齐}$$
(3)

控制目标是确定输入矢量\({\mathbf{u}}_{d}(x,t)\)这样输出向量\({\mathbf{y}}(x,t)\)能够跟踪期望的可行轨迹\({\mathbf{y}}{d}(x,t)\),即寻找相应的期望输入\({\mathbf{u}}{d}(x,t)\)这样系统的实际输出(1),

$${\mathbf{y}}^{*}(x,t)=C(t$$

接近所需输出\({\mathbf{y}}{d}(x,t)\).由于系统中存在不确定性,很难获得完整的跟踪,所以我们将逐步获得控制序列\({{\mathbf{u}}{k}(x,t)}\),使用ILC方法,以便

$$\lim_{k\to\infty}{\mathbf{u}}{k}(x,t)={\mathbf{u{}}{d}(x,t)$$

其中k个第次迭代控制输入满足

$$\left\{\textstyle\开始{数组}{l}\frac{\partial^{2}{\mathbf{q}}_{k}(x,t)}{\paratil{t^{2{}}=D\三角形{\mathbf{q{}}_}k}}_{k}(x,t),\\{mathbf{y}}_{k}(x,t)=C。\结束{array}\displaystyle\right$$
(4)

假设2.1

我们假设存在唯一的有界经典解\({\mathbf{q}}}(x,t)\)用于系统(1). 因此,对于期望的输出\({\mathbf{y}}{d}(x,t)\),存在唯一的\({\mathbf{u}}{d}(x,t)\)这样的话

$$\left\{\textstyle\begin{数组}{l}\frac{\partial^{2}{\mathbf{q}}_{d}(x,t)}{\partical{t}^}}=d\三角形{\mathbf{q{}}_}d}}{d}(x,t),\\{mathbf{y}}{d{(x、t)=C(t){mathbf{q}}{{d}(x,t)+G(t)},\结束{数组}\显示样式\右$$
(5)

满足初始和边界条件

$$\开始{aligned}&{mathbf{q}}_{d}(x,t)=0,\quad(x,t)\in\partial\Omega\times[0,t],\end{aligned}$$
(6)
$$\begin{aligned}和{\mathbf{q}}_{d}(x,0)={\mathbf{q{}}_}d0}(x),\qquad\frac{\partial{\mat血红蛋白{q}{{d}(x,t)}{\partitle t}\bigg|_{t=0}={\dot{\mat乙肝{q}}{d0}_(x),\quad x\in\Omega,\end{alinged}$$
(7)

哪里\({\mathbf{q}}{d}(x,t)\)是期望的状态,并且\(({\mathbf{q}}{d0}(x),{\dot{\mat血红蛋白{q}{{d0neneneep(x))是所需状态的初始值。

假设2.2

在学习过程中,我们假设以下边界和初始条件:

$$\开始{aligned}&{mathbf{q}}_{k}(x,t)=0,\quad(x,t)\in\partial\Omega\times[0,t],\end{aligned}$$
(8)
$$\boot{aligned}&{\mathbf{q}}_{k}(x,0)=\varphi_{k}(x),\qquad\frac{\partial{\mathbf{q}}_{k}(x,0)}{\partial t}=\pis_{k}(x),\quad x\in\Omega。\结束{对齐}$$
(9)

功能\(\varphi_{k}(x)\)\(\psi_{k}(x)\)满足

$$\biggl\Vert\frac{\partial\varphi_{k+1}}{\parial x}-\frac{\spartial\ varphi_}k}(x)}{\protialx}\biggr\Vert_{{\mathbf{L}^{2}(\Omega)}}^{2}\leqslate L_{1}\alpha^{k},\qquad\Vert_psi_{k+1}-\psi_}k}\Vert_{{{{6}{L}^{2}(\Omega)}}^{2]\leqslatel L_{2}\beta^{k}$$
(10)

哪里\(l{1}\)\(l{2}\)是常数,并且\([0,1)中的α、β.

备注2.1

假设2.1是ILC方法的必要条件。假设2.2意味着在初始状态下,ILC系统中可能存在错误和相同的初始条件(4)不需要。另一方面,从实际角度来看,在迭代中,初始条件重置应该越来越接近所需状态的初始值,因此条件(10)是合理的。

ILC设计与收敛性分析

在本文中,我们采用了以下P型ILC定律:

$${\mathbf{u}}_{k+1}(x,t$$
(11)

哪里\(\伽马射线(t)\)就是学习的收获。

为了简短的介绍,让我们

$$开始{对齐}&{\mathbf{e}}_{k+1}(x,t)$$

哪里\({\mathbf{e}}_{k+1}(x,t)\)是的跟踪误差\((k+1)\)第次迭代。然后可以将控制目标重写为

$$\lim_{k\to\infty}\bigl\Vert{\mathbf{e}}_{k}(\cdot,t)\bigr\Vert_{\mathbf{L}^{2}(\ Omega)}=0,\quad\对于[0,t]中的所有t$$
(12)

备注3.1

国际法委员会法律(11)是分布式的,也就是说,它取决于时间和空间。虽然许多分布式系统要求只有边界控制可以用作物理约束,但分布式传感器/致动器可以有效地应用于支持材料科学和技术的最新发展[21]例如压电陶瓷。

我们需要以下技术引理,这些引理广泛用于证明主定理。

引理3.1

([25])

\(A\in\mathbf{R}^{n\timesm}\)\(B\in\mathbf{R}^{n\times l}\)\(\zeta\in\mathbf{R}^{m}\)\(\eta\in\mathbf{R}^{l}\).那么我们有

$$\zeta^{\mathrm{T}}A^{\methrm{T}}B\eta\leqslate\frac{1}{2}\bigl$$
(13)

引理3.2

([13])

设一个非负实级数 \({a{k}{k=0}^{infty}) 满足

$$a{k+1}\leqslater r{k}+z{k}$$
(14)

哪里 \(0\leq倾斜r<1\) \(\lim_{k\rightarrow\infty}z_{k}=0\).那么我们有

$$\lim_{k\rightarrow\infty}a_{k}=0$$
(15)

定理3.1

考虑ILC更新法(11)应用于重复系统(1)在下面(2), ()和满足假设 2.1 2.2.如果增益矩阵 \(\伽马射线(t)\) 满足

$$\bigl\Vert I-G(t)\Gamma(t)\ bigr\Vert^{2}\leqslate\rho\in[0,1),\quad 2\rho<1$$
(16)

则跟踪误差在以下意义上收敛为零 \(\mathbf{左}_{2}\) 所有人的标准 \(在[0,t]\中) 作为 \(k\rightarrow\infty\)就是这样

$$\begin{aligned}\lim_{k\to\infty}\bigl\Vert{\mathbf{e}}_{k}(\cdot,t)\bigr\Vert_{\mathbf{L}^{2}(\ Omega)}=0,\quad\forall t\0 in[0,t]。\结束{对齐}$$
(17)

证明

根据学习规律(11),我们有

$$开始{对齐}{\mathbf{e}}_{k+1}1}(x,t)-{\mathbf{u}}_{k}(x,t)\bigr)-C(t)\bigl f{q}}_{k+1}(x,t)-{\mathbf{q}}{k}$$
(18)

哪里

$$\hat{{mathbf{e}}}_{k}(x,t)\triangleq\bigl{k}(x,t)\更大)$$

然后,通过引理3.1我们有

$$\开始{aligned}{\mathbf{e}}_{k+1}^{\mathrm{T}}(x,T){\mathbf{e{}_{k+1}(x,T)=&\bigl(\hat{{mathbf}e}}^{T}(T)_{k} (x,t)+\hat{{mathbf{q}}}^{T}(T)_{k} (x,t)\bigr)\bigl(\hat{{mathbf{e}}_{k}(x,t)+\hat}{mathbf{q}}_}k}^{T}(T)_{k} (x,t)\hat{\mathbf{e}}_{k}(x,t)+\hat{\mathbf{q}}}^{T}_{k} (x,t){{\mathbf{q}}}_{k}(x,t)\bigr]\\leqsleat&2\lambda_{G\Gamma}{\mathbf{e}}^{T}(T)_{k} (x,t){\mathbf{e}}_{k}(x,t)+2\lambda{C}\bar{{mathbf}q}}}^{T}(T)_{k} (x,t)\bar{{mathbf{q}}}{k}(x,t),\end{aligned}$$
(19)

哪里

$$\lambda_{G\Gamma}=\max_{0\leqslate t\leqslide t}\bigl\{bigl\Vert I-G(t)\Gamma(t)\ bigr\Vert^{2}\bigr\},\qquad\lambda_{C}=\max_{0\ leqsleat t\leqblate t}\bigl{bigl\ Vert C(t)\sbigr\Vert^{2]\bigr$$

发件人(4)和来自

$$\frac{\partial^{2}{\mathbf{q}}_{k+1}(x,t$$
(20)

我们有

$$\frac{\partial^{2}{\bar{\mathbf{q}}}_{k}(x,t{k}(x,t)$$
(21)

我们定义

$$\frac{\partial^{2}{\bar{\mathbf{q}}}_{k}(x,t \mathbf{q}}}{{k}(x,t)$$

然后由(21)我们获得

$$开始{对齐}2\int_{\Omega}\dot{{\bar{\mathbf{q}}}{{k}^{\mathrm{T}}}{{k}^{\mathrm{T}}(x,T)\bigl[d\triangle\bar{\mathbf{q}}{k}}x\=&2\int_{\Omega}\dot{{\bar{\mathbf{q}}}{{k}^{\mathrm{T}}(x,T)D\triangle\bar{\ mathbf}}{k}(x,T){T}}(x,T)A(T)\点{{\bar{\mathbf{q}}}{{k}(x,T),{\mathrm{d}}x\\triangleq&\sum_{i=1}^{3}i{i},\end{aligned}$$
(22)

哪里

$$\begin{aligned}&I_{1}=2\int_{\Omega}\dot{\bar{\mathbf{q}}}}{{k}^{\mathrm{T}}}}{k}^{mathrm{T}}(x,T)A(T)\dot{{bar{mathbf{q}}}{{k}(x,T)\bar{\mathbf{u}}_{k}(x,t)\,{\mathrm{d}}x.\end{aligned}$$

请注意

$$2\int_{\Omega}\dot{{\bar{\mathbf{q}}}{{k}^{\mathrm{T}}}{k}(\cdot,T)\|^{2}_{\mathbf{L}^{2}(\Omega)}{{\mathrm{d}}t}$$
(23)

使用边界条件并注意\(D=\operatorname{diag}\{D_{1},D_{2},\ldots,D_}\}\)\(0<p_{i}\leqslated d_{i}<\infty\)(\(i=1,2,\ldot,n)),以及\(p_{i}\)我们已经知道了

$$开始{对齐}I_{1}=&-2\sum_{I=1}^{n}\int_{\Omega}\nabla\dot{{\bar{\mathbf{q}}}}_{ki}^{\mathrm{T}}(x,T)d_{I}\napla{{\bar{\mathbf{q{}}}}_{ki}(x,T)\,{mathrm}x\\leqslian&-\lambda{\mathrm{min}}(d)\frac{\mathrm{d}(\|nabla\bar{\mathbf{q}}_{k}(\ cdot,T)\|^{2}_{{\mathbf{L}^{2}(\Omega)}}{\mathrm{d}t}。\结束{对齐}$$
(24)

与此同时,因为

$$I_{2}\leqslide-2\lambda_{\mathrm{min}}(A)\bigl\Vert\dot{{bar{\mathbf{q}}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}$$
(25)

使用引理3.1再次为\(I_{3}\),我们得到

$$I_{3}\leqslide\bigl\Vert\dot{{bar{\mathbf{q}}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{B}\bigl\Vert{{bar{\mathbf{u}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}$$
(26)

所以从(22)和(24)-(26)我们获得

$$\开始{aligned}\frac{\mathrm{d}(\Vert\dot{{bar{\mathbf{q}}}}_{k}(\ cdot,t)\Vert^{2}_{\mathbf{L}^{2}(\Omega)}){{\mathrm{d}}t}\leqsleat&-\lambda_{\mathrm{min}}(d)\frac{\mathm{d}\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,t)\Vert^{2}_{{\mathbf{L}^{2}(\Omega)}}{\mathrm{d}t}-2\lambda_{\mathlm{min}}(A)\bigl\Vert\dot{{\bar{\mathbf{q}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\\&{}+\bigl\Vert\dot{{\bar{\mathbf{q}}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{B}\bigl\Vert{bar{\mathbf{u}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)},\end{aligned}$$
(27)

也就是说,

$$\开始{aligned}&\frac{\mathrm{d}(\Vert\dot{\bar{\mathbf{q}}}_{k}(\ cdot,t)\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{\mathrm{min}}(D)\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,t)\Vert^{2}_{\mathbf{L}^{2}(\Omega)})}{\mathrm{d}}t}\\&\quad\leqslide-2\lambda_{\mathm{min}}(A)\bigl\Vert\dot{{\bar{\mathbf{q}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\bigl\Vert\dot{{\bar{\mathbf{q}}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{B}\bigl\Vert{bar{\mathbf{u}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}。\结束{对齐}$$

因为\(A(t)\)都是正定矩阵\(在[0,t]\中),我们得到

$$\开始{aligned}&\frac{\mathrm{d}(\Vert\dot{\bar{\mathbf{q}}}_{k}(\ cdot,t)\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{\mathrm{min}}(D)\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,t)\Vert^{2}_{\mathbf{L}^{2}(\Omega)})}{\mathrm{d}t}\\&\quad\leqslide\bigl\Vert\dot{{\bar{\mathbf{q}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{B}\bigl\Vert{bar{\mathbf{u}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\\&\quad\leqslated\bigl(\bigl\Vert\dot{{\bar{\mathbf{q}}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{\mathrm{min}}(D)\bigl\Vert\nabla\bar{\mathbf{q}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\bigr)+\lambda_{B}\bigl\Vert{\bar{\mathbf{u}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}。\结束{对齐}$$
(28)

通过Bellman-Gronwall不等式,我们得到

$$\开始{aligned}&\bigl\Vert\dot{\bar{\mathbf{q}}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{\mathrm{min}}(D)\bigl\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\\&\quad\leqsland\bigl(\bigl\Vert\dot{\bar{\mathbf{q}}_{k}(\ cdot,0)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}+\lambda_{\mathrm{min}}(D)\bigl\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,0)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\biger)e^{t}+\lambda_{B}\int_{0}^{t} e(电子)^{(t-s)}\bigl\Vert{\bar{\mathbf{u}}_{k}(\cdot,s)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\,\mathrm{d} 秒\\&\quad\leqslide\bigl(\lambda_{\mathrm{min}}(D)l_{1}\alpha^{k}+l_{2}\beta^{k{bigr)e^{t}+\lambda _{B}\int_{0}^{t} e(电子)^{(t-s)}\bigl\Vert{\bar{\mathbf{u}}_{k}(\cdot,s)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\,\mathrm{d} 第条。\结束{对齐}$$
(29)

由于庞加莱不等式,存在一个常数\(c{0}=c{0}(\欧米茄)\)这样的话

$$\bigl\Vert\bar{\mathbf{q}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\leqslide c_{0}\bigl\Vert\nabla\bar{\mathbf{q}}_{k}(\ cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}$$
(30)

因此,通过(29)和(30)我们有

$$\开始{aligned}\bigl\Vert\bar{\mathbf{q}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\leqslide&\frac{c{0}{\lambda_{\mathrm{min}}(D)}\biglλ{\mathrm{min}}(D)}\int_{0}^{t} e(电子)^{(t-s)}\bigl\Vert{\bar{\mathbf{u}}_{k}(\cdot,s)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\,\mathrm{d} 第条。\结束{对齐}$$
(31)

选择足够大的常数\(λ>1)并将两边相乘(31)由\(e^{-\lambda t}\),我们有

$$\开始{aligned}\bigl\Vert\bar{\mathbf{q}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}e^{-\lambda t}\leqslate&\frac{c{0}}{\lambda_{\mathrm{min}}{0}\lambda_{B}}{\lambada_{\mathrm{min}}(D)}\int_{0}^{t} e(电子)^{-(\lambda-1)(t-s)}\bigl\Vert{\bar{\mathbf{u}}_{k}(\cdot,s)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}e^{-\lambda s}\,\mathrm{d} 秒\\leqslate&\frac{c{0}}{\lambda_{\mathrm{min}}(D)}\bigl \mathbf{u}}_{k}\Vert_{(\mathbf{l}^{2};\lambda)}\int_{0}^{t} 电子^{-(\lambda-1)(t-s)}\,\mathrm{d} 秒\\leqslate&\frac{c{0}}{\lambda_{\mathrm{min}}(D)}\bigl垂直{\bar{\mathbf{u}}}_{k}\Vert_{(\mathbf{l}^{2};\lambda)}。\结束{对齐}$$
(32)

另一方面,根据P型国际法委员会的法律(11),我们有

$$\bigl\Vert u_{k+1}(\cdot,t)-u_{k}}^{2}(\Omega)}^{2]$$
(33)

出租\(\lambda_{\Gamma}=\max_{0\leqsleat t\leqslatel t}\{\lambda{\mathrm{max}}(\Gamma^{t}(t)\Gamma(t,我们有

$$\|u{k+1}-u{k}\|_{(\mathbf{L}^{2};\lambda)}\leqslate\lambda_{Gamma}\|e_{k{(\ mathbf}^{2];\lambda){$$
(34)

还有

$$\开始{aligned}\bigl\Vert\bar{\mathbf{q}}_{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}e^{-\lambda t}\leqslate&\frac{c{0}{\lambda_{\mathrm{min}}\lambda_{\Gamma}}{\lambada_{\mathrm{min}}(D)(\lambda-1)}\Vert{\bar{\mathbf{u}}_{k}\Vert^{2}_{(\mathbf{L}^{2};\lambda)}。\结束{对齐}$$
(35)

发件人(18), (23)、和(24)我们有

$$\begin{aligned}\Vert{\mathbf{e}}_{k+1}\Vert_{(\mathbf{L}^{2};\lambda)}\leqslate&\biggl(2\lambda_{G\Gamma}+\frac{2c{0}\lambda_{C}\lampda_{Gamma}\lamda{B}{\lambada_{min}(D)(\lambda-1)}\biggr)\Vert{\mathbf{e}}_{k}\Vert_{(\mathbf{L}^{2};\lambda)}\\&{}+\frac{2c{0}\lambda_{C}}{\lambda_{mathrm{min}}(D)}\bigl(\lambda_{\mathrm{min}}(D)l_{1}\alpha^{k}+l_{2}\beta^{k{biger)。\结束{对齐}$$
(36)

然后,通过(16),我们可以选择合适的大号λ这样的话

$$\lambda>1\quad\text{和}\quad 2\lambda_{G\Gamma}+\frac{2c_{0}\lambda{C}\lampda_{Gamma}\lambeda_{B}{lambda_{mathrm{min}}(D)(\lambada-1)}<1$$
(37)

\(z{k}=\frac{2c{0}\lambda{c}}{\lambada{\mathrm{min}}(D)}(\lambda{\mathr{min}}(D)l_{1}\alpha^{k}+l_{2}\beta^{k{).然后通过引理3.2和(36)-(37)我们有

$$\lim_{k\rightarrow\infty}\|{\mathbf{e}}_{k+1}\|_{(\mathbf{L}^{2};\lambda)}=0$$
(38)

最后,通过不等式

$$\Vert{\mathbf{e}}_{k}\Vert_{(\mathbf{L}^{2};\lambda)}\leqslated\sup_{0\leqsplate t\leqslide t}\bigl\Vert}{e}{k}(\cdot,t)\bigr\Vert^{2}_{\mathbf{L}^{2}(\Omega)}\leqslated\lambda^{T}\Vert{\mathbf{e}}_{k}\Vert_{(\mathbf{L}^{2{;\lambda)}$$
(39)

我们有收敛性

$$\lim_{k\rightarrow\infty}\bigl\Vert{\mathbf{e}}_{k}(\cdot,t)\bigr\Vert_{\mathbf{L}^{2}(\ Omega)}=0,\quad t\in[0,t]$$
(40)

这就完成了定理的证明3.1. □

备注3.2

在定理中3.1,我们必须指出(16)需要\(G(t)\)要成为非奇异矩阵(或正则矩阵),即系统的输出和输入之间存在直接通道(1). 我们会考虑这个案子\(G(t)=0)未来。

4数值模拟

为了说明所提出的ILC方案的有效性,我们给出了以下具体的数值示例:

$$\left\{\textstyle\begin{array}{l}\frac{\partial{\mathbf{q}}(x,t(t){\mathbf{q}}(x,t)+G(t)}\mathbf{u}}$$
(41)

哪里

$$\begin{aligned}&{\mathbf{q}}(x,t)=\左[\textstyle\begin数组}{@{}c@{}}q_{1}(x,t)\\q_{2}(y,t)\end数组}\displaystyle\right],\qquad{\mathbf{u}}}(x,t)\end{array}\displaystyle\right],\qquad{\mathbf{y}}(x,t)=\left[\textstyle\begin{array}{@{}c@{}}y{1}(y,t)\\y{2}(x,t)\end{数组}\displaystyle\right],\\&D=\left[\textstyle\begin{array}{@{}c@{quad}c@}}1&0\\0&1\end{array}\disposystyle\\right]四元B=\left[\textstyle\begin{array}{@{}c@{quad}c@}}1/3&0\\0.25&0.2\end{arrays}\显示样式\right],\\&C=\left[\textstyle\begin{array}{@{}C@{quad}C@}}0.25&1\\0&0.25\end{arrary}\displaystyle\right]{\quad}C@{}}0.85&0\\0&0.9\end{array}\displaystyle\right],\结束{对齐}$$

\((x,t)在[0,1]\次[0,1]/)所需的进化轮廓向量作为迭代学习给出:

$${\mathbf{y}}_{d}(x,t)=\bigl^{-2t}-1\bigr)\sin\pi x,-4\sin\πt\sin2\pi x\bigr$$

两个初始状态配置文件都是\(瓦尔菲{1}(x)=0.02x)\(瓦尔菲{2}(x)=0.01\sin x),所以\(\psi{1}(x)=\psi}2}(x)=0\),并且在学习开始时控制的输入值被设置为0和\(阿尔法=贝塔=0)英寸(10). 然后是定理的条件3.1感到满意。也就是说,\(I-G\伽玛=0.15<0.5)。我们使用以下正向差分法:

$$开始{aligned}和\frac{partial^{2}{\mathbf{q}}_{k}(x,t)}{\partial{x^{2{}}=\frac{{mathbf}(x{i-1},t{j})-2{mathbf{q}(xr{i},t_j}h^{2}},\\&\frac{\partial^{2{{\mathbf{q}}_{k}(x,t)}{\partical{t^}}=\frac}{\mathbf{q{}(x{i},t{j-1})-2{\mathpf{qneneneep(x{ic},t_j})}{\tau^{2}},\\&\frac{\partial{\mathbf{q}}_{k}(x,t)}{\paratil{t}}=\frac{{\mathbf{q{}(x{i},t{j+1})-{\mat血红蛋白{q}{(x_i}、t{j})}{\tau},\\&{\mathpf{y}}(xr{i},t{j})=C(t_i}){\mathbf{q}}(x_{i},t_{j})+G(t_{i}){\mathbf{u}}$$

哪里小时τ分别是空间和时间大小,以及\((x{i},t{j})\)是离散点。

迭代学习过程如下:

  • 步骤1.迭代次数\(k=0)(为了方便起见,迭代时间从0开始)。

    1. 1.1.

      让控制输入\({\mathbf{u}}{0}(x,t)=0\)具有\({\mathbf{q}}{0}(0,t)=0={\mathbf{q{}{0{(1,t)\)\({\mathbf{q}}{0}(x,0)\)\(分数{\部分{\mathbf{q}}{0}(x,0)}{\部分t}\)\(A(t)\)\(B(t)\)基于二阶微分方程和上述差分方法,我们可以求解(4)并获得\({\mathbf{q}}{0}(x,t)\).

    2. 1.2.

      根据输出方程式\({\mathbf{y}}_{0}(x,t)=C(t){\mathbf{q}}_}0}我们计算\({\mathbf{y}}{0}(x,t)\).

    3. 1.3.

      计算\({\mathbf{e}}{0}(x,t)={\mathbf{y}}{d}(x,t)-{\mat血红蛋白{y}{0{(x、t)\).

  • 步骤2.迭代次数\(k=1)\({\mathbf{u}}{1}(x,t)={\mathpf{u{}}{0}(x,t)+\Gamma(t){\mathbf{e}}{0}(y,t)\).

  • 步骤3.重复步骤1,但使用控制输入\({\mathbf{u}}{1}(x,t)\)(≠0),我们得到\({\mathbf{e}}{1}(x,t)\).

  • 步骤4.在k个第次迭代,如果跟踪误差\({\mathbf{e}}{k}(x,t)\)小于给定的错误,然后结束,否则继续。

应该指出,我们不需要知道(但需要有界)不确定系数\(A(t)\)\(B(t)\)\(C(t)\)\(G(t)\)在实际过程控制中;我们只需要记住跟踪误差并计算(离线)下一次控制输入\({\mathbf{u}}{k+1}(x,t)\).

使用该迭代学习算法和差分方法获得的仿真结果如图所示1-7.

图1
图1

所需表面 \(\pmb{y{d1}(x,t)}\) .

数字12显示所需的外形,图4显示第二十次迭代的相对轮廓,图56显示误差曲面,其中\(e{ki}(x,t)=y{di}\(i=1,2)\(k=20).图7是描述最大跟踪误差随迭代次数变化的曲线图。数值上,在第二十次迭代中,最大跟踪误差的绝对值为\(1.9185\次10^{-8}\)\(1.5564\时间10^{-9}\)这些仿真结果证明了ILC法则的有效性(11).

图2
图2

所需表面 \(\pmb{y{d2}(x,t)}\) .

图3
图3

输出曲面 \(\pmb{y{k1}(x,t)}\) .

图4
图4

输出曲面 \(\pmb{y{k2}(x,t)}\) .

图5
图5

错误表面 \(\pmb{e_{k1}(x,t)}\) .

图6
图6

错误表面 \(\pmb{e_{k2}(x,t)}\) .

图7
图7

最大误差迭代次数曲线。

5结论

本文将P型ILC律应用于一类具有耗散和有界系数不确定性的MIMO二阶双曲偏微分方程。我们建立了保证跟踪误差收敛的充分条件\(\mathbf{L}^{2}\)规范。仿真实例表明了该算法的有效性。

参考文献

  1. Arimoto,S,Kawamura,S,Miyazaki,F:通过学习改进机器人操作。J.机器人。系统。1(2), 123-140 (1984)

    第条 谷歌学者 

  2. Oh,S,Bien,Z,Suh,I:机器人机械手的迭代学习控制方法及其应用。IEEE J.机器人。自动。4(5), 508-514 (1988)

    第条 谷歌学者 

  3. Hou,ZS,Xu,JX,Freeway,ZHW:使用基于匝道计量和速度信号的迭代学习控制的交通控制。IEEE传输。车辆。Technol公司。56(2), 466-477 (2007)

    第条 谷歌学者 

  4. Wang,YQ,Dassau,E,Doyle,FJ III:人工胰腺的近距离控制β-模型预测迭代学习控制在糖尿病细胞中的应用。IEEE传输。生物识别。工程师。57(2), 211-219 (2010)

    第条 谷歌学者 

  5. 阮,XE,万,BW:饱和非线性时滞工业控制系统的迭代学习控制。《汽车学报》。罪。27(2), 219-223 (2001)

    谷歌学者 

  6. Chen,HF:随机系统迭代学习控制的几乎必然收敛性。科学。中国,Ser。F、 信息科学。46(1), 67-70 (2003)

    第条 数学科学网 数学 谷歌学者 

  7. Chen,WS,Zhang,ZQ:未知时变参数和未知时变时滞的非线性自适应学习控制。亚洲J.控制13(6), 903-913 (2011)

    第条 数学科学网 数学 谷歌学者 

  8. Liu,SD,Wang,JR,Wei,W:脉冲微分方程迭代学习控制的研究。Commun公司。非线性科学。数字。模拟。24(1-3), 4-10 (2015)

    第条 数学科学网 谷歌学者 

  9. Zhang,CL,Li,JM:控制方向未知的严格反馈非线性时变系统非均匀轨迹跟踪的自适应迭代学习控制。申请。数学。模型。39(10-11), 2942-2950 (2015)

    第条 数学科学网 谷歌学者 

  10. 摩尔,KL:确定性系统的迭代学习控制。施普林格,伦敦(1993)

     数学 谷歌学者 

  11. Bien,Z,Xu,JX:迭代学习控制分析、设计、集成和应用。Kluwer学术,波士顿(1998)

     谷歌学者 

  12. Xu,JX,Tan,Y:线性和非线性迭代学习控制。控制与信息科学课堂讲稿,第291卷。柏林施普林格出版社(2003)

    数学 谷歌学者 

  13. Chen,YQ,Wen,CY:迭代学习控制——收敛性、鲁棒性和应用。控制与信息科学讲座笔记,第248卷。施普林格,柏林(2003)

    数学 谷歌学者 

  14. Ahn,HS,Moore,KL,Chen,YQ:迭代学习控制:区间系统的鲁棒性和单调收敛性。柏林施普林格出版社(2007)

     数学 谷歌学者 

  15. Qu,ZH:拉伸运动弦边界控制的迭代学习算法。自动机38(1), 821-827 (2002)

    第条 数学科学网 数学 谷歌学者 

  16. Zhao,H,Rahn,CD:单跨轴向移动材料的迭代学习速度和张力控制。J.戴恩。系统。测量。控制130(5), 051003 (2008)

    第条 谷歌学者 

  17. Xu,C,Arastoo,R,Schuster,E:关于抛物线分布参数系统的迭代学习控制。In:程序。第17届地中海控制自动化会议,希腊塞萨洛尼基马克多尼亚宫,第510-515页(2009)

    谷歌学者 

  18. Yu,XL,Wang,JR:一类脉冲一阶分布参数系统迭代学习控制的统一设计与分析。高级差异。埃克。2015,261(2015)

    第条 数学科学网 谷歌学者 

  19. Huang,DQ,Xu,JX:一类非线性PDE过程的稳态迭代学习控制。J.过程控制11(8), 1155-1163 (2011)

    第条 数学科学网 谷歌学者 

  20. 黄,DQ,徐,JX,李,XF,徐,C,余,M:齐次热方程类的D型预测迭代学习控制。Automatica公司49(8), 2397-2408 (2013)

    第条 数学科学网 谷歌学者 

  21. Cichy,B,Gakowski,K,Rogers,E:使用Crank-Nicholson离散化的时空动力学迭代学习控制。多维空间。系统。信号处理。23(1-2), 185-208 (2012)

    第条 数学科学网 数学 谷歌学者 

  22. 黄,DQ,李,XF,徐,JX,徐,C,何,W:非均匀分布参数系统的迭代学习控制-频域设计和分析。系统。控制信函。72, 22-29 (2014)

    第条 数学科学网 数学 谷歌学者 

  23. Choi,JH,Seo,BJ,Lee,KS:双曲线偏微分方程的约束数字调节:一种学习控制方法。韩国J.Chem。工程师。18(5), 606-611 (2001)

    第条 谷歌学者 

  24. Dai,XS,Tian,SP:一阶强双曲型分布参数系统的迭代学习控制。控制理论应用。29(8), 1086-1089 (2012)

    谷歌学者 

  25. 谢,SL,田,SP,谢,ZD:迭代学习控制的理论与应用。科学出版社,北京(2005)

    谷歌学者 

下载参考资料

致谢

作者感谢审稿人对手稿的仔细阅读和宝贵的评论。作者们也感谢编辑的帮助。这项工作得到了国家自然科学基金(No.61364006,61374104)和广西教育厅智能综合自动化重点实验室、广西高校优秀青年教师培养项目的支持。

作者信息

作者和附属机构

作者

通讯作者

与的通信西胜代.

其他信息

竞争性利益

作者声明,他们没有相互竞争的利益。

作者的贡献

这项工作是在所有作者的合作下进行的。XD在这项研究中提出了这些有趣的问题。CX、ST和XD证明了这些定理,解释了结果,并撰写了这篇文章。ZL给出了算例。所有作者确定了研究主题,阅读并批准了手稿。

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用本文

Dai,X.,Xu,C.,Tian,S。等。具有不确定性的MIMO二阶双曲分布参数系统的迭代学习控制。高级差异Equ 2016, 94 (2016). https://doi.org/10.1186/s13662-016-0820-8

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13662-016-0820-8

关键词