×

随机不确定性下的优化。方法、控制和随机搜索方法。 (英语) Zbl 1527.49002号

运筹学与管理科学国际系列296.查姆:施普林格出版社(ISBN 978-3-030-55661-7/hbk;978-3-0.30-55664-8/pbk;978-1-030-55662-4/电子书)。xiv,第393页。(2020).
这本书致力于研究随机不确定性下的优化问题,包括四个部分、18章和3个附录。
第1部分描述了随机优化工具。它分为5章。
在第一章中,作者首先介绍了随机参数写为:(overset{.}{z}(t)=g(t,omega,z(t),u(t))的一阶微分方程的基本控制系统,对于(t_{0},leq t\leq t_{f})和(omega,In,omega)。这里,\(z=z(t,\omega)\in\mathbb{R}^{m}\)是状态变量,\(\omega \)取其在概率空间中的值\((\omega,\mathcal{a},P)\),\(\ omega \)作为基本事件的集合,(mathcal{A})是事件的(sigma)代数,(P)是概率测度,(u(t)在mathbb{R}^{n}中是确定性或随机控制输入,属于合适的线性空间(u),函数(g:[t_{0},t_{f}]times\Omega\times\mathbb}R}^m}times\mathbb_2R}^}^n}\rightarrow\mathbb{R}^{m}\)至少是连续的。施加初始条件\(z(t_{0})=z{0}(\omega)\in\mathbb{R}^{m}\),其中\(z{0{)是随机初始状态。作者观察到,这个问题可以用积分方程来表示。他引入了一个(r)维随机过程(θ=theta(t,omega)),取(g(t,ω,z,u)=widetilde{g}(t,θ右箭头mathbb{r}^{m})是具有连续Jacobians(D_{theta})的连续函数\关于(θ,z,u),(u)作为所有调节函数的巴拿赫空间(u(cdot):[t_{0},t_{f}]\rightarrow\mathbb{R}^{n}),由上确界范数规范化ty}\),\(z=C_{0}^{m}[t_{0},t_{f}]\)和\(theta(\cdot,\omega)\在Theta=C_{0}^{r}[t_{0},t_{f}]a.s.中,他考虑了这个问题:(overset{.}{z}(t)=widetilde{g}{z}(z)_{0}(\omega)\in\mathbb{R}^{m}\)。在正则性和有界性条件下,该初值问题具有唯一解。他引入了目标函数(F=F(u(\cdot))=Ef(\omega,S(\omega,u(\cdot)),u(\tdot)),其中(E=E(\cdot\mid\mathcal{答}_{t{0}})表示给定信息的条件期望{答}_{t_{0}})关于控制过程到所考虑的开始时间点\(t_{0{),和\(f=f(ω,z(cdot),u(cdot并且在终点\(z{f}=z(t{f},\omega)\),\(z(\cdot)\在Z\)中,在u\)中为(u(\cdot)。这里,(L:[t_{0},t_{f}]\ times\Omega\times\mathbb{R}^{m}\ times\mathbb}R}^}n}\rightarrow\mathbb{R})和(G:[t_}0}、t_{f{]\ times\Omega\times\mathbb{R{m}\right arrow\ mathbb[R}\)给出了可测量的成本函数。作者假设(L(t,ω,ω_{z} L(左)(\cdot、\omega、\cdot和\cdot)\)、\(\nabla_{u} L(左)(\cdot、\omega、\cdot和\cdot)和(\nabla_{z} G公司(\cdot,\omega,\cdot)\)。随机不确定性下的最优控制包括找到最优控制对随机参数变化(u^{ast}(\cdot)),(u^}\ast},\cdot,)具有鲁棒性,满足(min F(u(\cdot])),使得D中的(u(\ cdot)\是容许控制集。作者引入了一个等效问题,假设对数据进行进一步假设。然后,他提出了三种控制律:开环控制,假设控制(u)是确定性的,闭环控制或具有随机函数(u)的反馈控制,开环反馈或控制/随机开环反馈,以及非线性模型预测控制/随机非线性模型。他展示了如何使用泰勒展开式导出近似控制问题,并在线性或次线性成本函数的情况下以及最后在上述归纳示例中进行了说明。
第二章致力于研究当前随机优化背景下的调节器。本章首先以随机不确定性下的主动控制为例。本文介绍了底层控制系统的动力学方程(F(p{D},q(t),overset{.}{q}(t{q}_{0}\),其中\(q=q(t)\)表示配置变量的向量,\(u=u(t)\)是控制或输入向量。系统的状态轨迹\(z(t)=\左(\开始{数组}{c}q(t)\\\重叠{.}{q}(t)\end{array}\right)\),(t{0}\leqt\leqt{f}\),是上述方程和初始条件的解,它与初始状态\(z{0}=\ left(\begin{arrary}{c}q{0}有关\\\重叠{.}{q}_{0}\end{array}\right)\)、控制或输入矢量\(u=u(t)\)和动态参数矢量\(p_{D}\)。控制函数\(u=u(t)\),\(t_{0}\leqt\leqt_{f}\)表示为:\(u(t(t),(t{0}\leqt\leqt{f})是一个控制校正,由反馈控制表示。PID调节器定义为:\(Delta u(t)=\varphi(t,\ Delta q(t),\ Deltaq{I}(t)、\ Delta\ overset{.}{q}(t))^{t} 问(τ)d\tau\),\(t_{0}\leqt\leqt_{f}\)表示积分位置,\(δq_{I}(t)=\int_{t_{0{}^{t}\δq(τ。作者对误差进行了计算,他专门研究二次成本函数的情况,特别是使用泰勒展开式。这最终导致了一个近似的调节器优化问题,作者以一个例子结束了本章。
在第三章中,作者重点研究了随机不确定性下动态系统的最优开环控制问题。他定义了一个随机最优开环控制(u^{ast}=u^{ast}(t;t{0},z{0}),(t{0{leqt\leqt_{f}),作为随机优化问题的解决方案:\[\最小E \左(\int_{t_{0}}^{t_{f}}L(t,a(\omega),q(t),\overset{.}{q}(t)、u(t,z_{0}(\omega))dt+G(a(\omega),q,\] 这样:\(F(t,p(\omega),q(t),\超集{.}{q}(t),ω)=\覆盖{.}{q}_{0}(ω)\)取决于初始时间\(t{0}\)和初始状态\(z{0}=\左(\begin{array}{c}q{0}\\\重叠{.}{q}_{0}\end{数组}\right)\)。在费用函数(L)和(G)的特殊选择下,作者建立了费用函数期望的近似值,从而简化了优化问题。
在简短的第4章中,作者使用同伦方法构造反馈控制。他把控制系统的动力学方程写成一阶初值问题:(overset{.}{z}(t)=f(t,theta(\omega),z(t),u(t)),(t_{0}\leqt\leqt_{f}),(z(t_{0})=z_{0}(\omega\)。考虑到状态反馈控制的构造(u(t)=\varphi(t,z(t)),(t,geq t_{0}),其中(\varphi=\varpi),\(0\leq\epsilon\leq 1\),从开环控制(\(epsilon=0))\(u{OL}=\varphi_{0}(t,z)=u{0}(t,z{0})\),\(t_{0}\leqt\leqt_{f}\),.带时间函数\(t,z)\),\(t_{0}\leq-t\leqt_{f}\)。这导致了初值问题:\(overset{.}{z}(t)=f(t,theta(\omega),z(t),\varphi(t,z)),\(t_{0}\leqt\leqt_{f}\),\。经过一些计算,作者得到了在随机不确定条件下使成本最小化的最优反馈控制问题(最小E左(t,θ(ω),z(t,a(ω_{f} 一个(\omega))\mid\mathcal{答}_{t{0}}\右),受上述一阶初值问题和反馈控制\(u\)的影响。他将反馈控制的优化分解为两个阶段。
第5章考虑了基于状态向量(y)的技术或经济系统或结构的数学模型,该状态向量包含描述设备特性所需的最少内部状态变量。还引入了模型参数的矢量\(A \)、标称设计变量的矢量\(x \),以及在某些情况下控制变量的矢量\(u \)。模型参数的向量\(a=a(\omega)\)由概率空间\((\omega,\mathcal{a},P)\)上的随机向量表示。在结构系统可靠性理论中,引入了极限状态函数(g=g(a,x))来分离给定设计向量(x)的安全域和不安全域。极限状态函数(g)的初始表示为:(g(a)=\gamma(R(a)-L(a)),其中\(R=R(a,\cdot)\)是结构阻力,\(L=L(a,\ cdot))是外部荷载,\(\gamma\)是适当的函数。本章介绍了一种面向优化的方法,用于构造适当的极限状态函数。作者引入了状态方程(T(y,u,(a(omega),x))=0,y{0}子集中的(y),u{0}\中的(u R}^{m_{T}}\),以及可容许条件\(y\ in y(u,a(\omega),x)\)或\(y\in \mathrm{int}(Y(u,a(\omega),x)),其中\(Y(u,a(\ omega)、x)\)是可容许状态域,定义为\(Y是标量或(m{g})-向量响应函数,具有适当的分析性质(例如凸性、线性),并且通常与(y)具有仿射线性。假设可行状态域\(Y(u,a(\omega),x)\)是一个包含零状态作为内点的闭凸集,作者回顾了可容许条件可以用\(\pi(Y\mid Y(u,a(\omega),x))\leq 1\)或\(\pi(Y\mid Y(u,a(\omega),x))<1\)表示,其中\(\pi(Y\mid Y(u,a(\omega),x) )\)表示到由\(\pi(Y\mid Y)=inf\{\lambda>0:\ frac{Y}{\lampda}\ in Y\}\)定义的容许状态域\(Y(u,a(\omega),x)\的Minkowski距离泛函。作者编写了四个优化问题,其最小值函数是状态函数\(s^{ast}=s^{cast}(a(\omega),x)\)。他定义了安全状态的概念,并建立了此类安全状态的特征。他给出了具有安全状态的系统的示例,包括涉及时间参数的情况。
第2部分主要介绍随机搜索方法。从第6章开始,共分为三章。
在第6章中,作者考虑了全局优化问题\(\min F(x)\),使得\(x\In D\),其中\(D\)是\(\mathbb{R}^{n}\)的子集。他回忆起了根据递归关系构造的基本随机搜索例程,如果D中的(z{t+1})和F(z{t1})<F(X{t})或1,2,\ldots\),从起点\(X_{0}\)开始。他用集合\(B_{varepsilon,M}=\{y\ in D:F(y)\leq F^{ast}+\varepsillon),如果\(F^{last}\ in mathbb{R}\),和\(F(y。然后,他考虑了离散优化问题,假设(D)在(mathbb{R}^{n})中包含有限个元素,并证明了一个收敛结果。他提出了自适应随机搜索方法,引入了一组可接受的决策规则。本章最后对实值凸函数(F:\mathbb{R}\rightarrow\mathbb2{R}\)相对于(D=\mathbb{R})的最小化进行了更深入的分析。
第7章描述了不确定性下的受控随机搜索方法,它提高了基本搜索方法的收敛速度。它们基于转移概率(pi{t}(x^{t},cdot)=pi{t{(a,x^{t},cdot)),这些转移概率依赖于参数(a=(a{j}){j\ in j}\ in a\),以最佳方式选择。在每一步计算条件平均增益,包括成功面积(G{F}(x{t})),该面积可以通过二阶泰勒多项式近似值(F(z{t+1}),用随机搜索牛顿法近似,或不确定性下的序列随机决策过程和未知的贝叶斯模型。作者证明了所提出的受控随机搜索方法的收敛结果。
第8章介绍了用于全局优化的受控随机搜索过程。作者介绍了一种随机搜索方法,该方法根据(X{n+1}(ω)=z{n+1{)、if(D中的z{n+1})和(F(z{n+1})<F(X{n}(omega)(ω)=X{n}(ω\在D中是(D)中的给定起点,而(z{1}、z{2}、ldots、z{n}和ldots)是随机(D)-向量序列的实现,其条件分布涉及要选择的转移概率测度。他在适当的假设下证明了一个收敛结果。然后,他描述了与第8章中描述的随机搜索程序相关联的受控随机搜索方法,即顺序随机决策过程。他对最优控制进行了计算,并建立了此类受控随机搜索过程的收敛速度。本章最后通过一个修正的拟Newton条件描述了最优控制律的数值实现。
第三部分分析了随机搜索方法的收敛性和收敛速度。它分为9章,从第9章到第17章。
第9章从问题开始:(D}f(x)中的最小值{x\),其中\(f:D\rightarrow\mathbb{R}\)和\(D\subset\mathbb{R}^{D}\)不为空。作者假设(D)和(f)是可测量的。他把搜索问题写成:如果D中的(y_n})和(f(y_n{)<f(x_{n-1}),或者其他的,或者D:f(x)中的(x_n}=y_n}\cdot1_x}D:f(x)<f(x_{n-1})\}}(y_{n})\)中的\cdot 1_{mathbb{R}^{D}\设置减号\{x\。他推广了这一表述,引入了一个从\(\mathbb{R}^{d})^{n}\)到\(\mathbb{R}^{d}\)的转移概率序列,称为突变序列。他关联了一个选择序列,并建立了这些序列的属性。
第10章介绍了涉及绝对连续突变序列或随机方向方法的随机搜索方法,以及这些方法之间的联系。
第11章证明了关于随机搜索过程收敛性的可达性结果:(f(X_{n})\rightarrow\inf_X\in D}f(X)=f^{ast}),(P)-a.s.,(n\right箭头\infty),对于所有起点(D\中的X_{0})。作者在D:f(x)=f^{ast}}中定义了\(D^{ast{=\{x\),并在D:f(x)\leqa\}\中定义了(D_{a}=\{x),用于每个\(a\in\mathbb{R}\)\((X_{n}:n\in\mathbb){无}_{0})是一种具有任意突变序列((p_{n}:n\in\mathbb{n})和任意起始点(x_{0}\)的随机搜索方法,他证明了收敛性(lim_{n\rightarrow\infty}p(x_{n{n}\ in D_{a})=1\)的等价公式,以及出现此极限的充分条件。
第12章证明了第10章中提出的随机搜索方法的收敛结果。通过实例说明了结果。
第13章证明了正成功概率平稳随机搜索方法的收敛结果。
第14章介绍了收敛阶为O(n^{-\alpha})的随机搜索方法,第15章介绍了线性收敛速度的随机搜索法。通过算例说明了收敛结果。
第16章描述了基于非常简单的步长控制的随机方向程序。作者证明了收敛结果。
第17章介绍了混合随机搜索方法。
第4部分致力于通过随机搜索方法解决随机不确定性下的优化问题,并包含一个独特的章节。
在这里,作者考虑了D}F{0}(x)中类型为(min_{x\)的优化问题,假设只有关于目标函数(F_{0}\)的统计信息可用。只有概率空间((omega,mathcal{a},P)上的随机函数(f=f(\omega,x))的一个实现是可用的,因此(f_{0}(x))是\(f(\cdot,x):f_{0}(x)=Ef(\omega,x)\),\(x\ in D\)的期望。特殊情况由\(f(ω,x)=f{0}(x)+n(ω。给定随机函数(f{0})的(m)独立样本函数(f_{k}(x)=f(ω_{k{,x)),(k\ in m),使用估计目标函数(widehat{f}(x)=frac{1}{m}\sum_{k\ in m}f_{k}(x\)),并用(x{t+1}=Z{t+1}代替第二部分和第三部分已经考虑的基本随机搜索过程\),如果\(D\中的Z_{t+1}\)和\(widehat{F}_{t}(Z_{t+1}){F}(F)_{t} (X_{t})\)和\(X__{t+1}=X_{t}\),如果\(Z_{t+1}\notin D\)或\(\widehat{F}(F)_{t} (Z_{t+1})\geq\widehat{F}(F)_{t} (X_{t})\)。作者用概率(P(X{t}in B_{epsilon})证明了一个收敛结果,其中(epsilon)是一个(小)正数,D:F{0}(y)中的(B_{et}=y\,其中(F{0{ast}+epsilon\})中的。他最后给出了从位于外部或内部的点(X{t}=X{t})进入或离开(epsilon)最优点集(B_{epsilon})的概率估计。
这本书详细描述了如何解决具有不确定性的优化问题,重点是收敛结果。许多例子说明了结果。

MSC公司:

49-02 关于变分法和最优控制的研究说明(专著、调查文章)
49J55型 随机性问题最优解的存在性
49公里45 随机性问题的最优性条件
49号35 最优反馈综合
PDF格式BibTeX公司 XML格式引用
全文: 内政部