×

随机控制。哈密顿系统和HJB方程。 (英语) Zbl 0943.93002号

数学应用. 43. 纽约州纽约市:斯普林格。xx,第438页(1999年)。
本书是对随机微分方程(SDE)的有限时域最优控制的统一处理。
前言阐述了激发这一努力的主要问题。它们来源于1987年至1989年复旦大学关于以最佳方式控制依赖于控制扩散的SDE的研究。人们发现,必须引入二阶伴随方程,这导致对最优性的必要条件和充分条件之间的关系有了新的见解,这是本专著的中心主题。序言的其余部分清楚地介绍了这本书的内容,可以作为一篇像样的评论。
第一章是对随机微积分的一个很好的介绍,从概率空间的定义开始,接着介绍随机过程、停止时间、鞅、Itós积分、SDE及其强解和弱解。
第二章介绍了随机最优控制问题。在引入确定性情形及其在经济学和管理学中的应用之后,在弱形式和强形式下描述了随机最优控制问题。SDE约束使控制同时出现在漂移和扩散中。然后,作者给出了两个公式中解存在的充分条件(凸性假设),并证明了它们的陈述。一节证明了线性随机系统的可达集(处理某些存在性定理时的关键对象)可能不是凸的或闭的(在L^2(Omega,mathbb{R}^n)中)\(Omega)是概率空间的基础空间),与确定性情况相反,即使控制集是紧凑的。本文还介绍了其他地方研究的最优控制问题的其他示例。
第三章是最大值原理。首先,回顾了确定性情况,并像往常一样通过尖峰变化和Gronwall不等式证明了Pontryagin的结果。利用Clarke广义梯度的性质,在一些凸性假设下,这也是最优性的一个充分条件。然后,得到了随机最大值原理。除了通常求解反向SDE(BSDE)的伴随变量和噪声的“对偶”变量外,由于控制相关扩散,还必须引入两个与另一个BSDE相关的新矩阵变量。它们表示二阶信息,必须包含在最大值原理的哈密顿量表达式中。第二作者的证明[随机随机报告36,No 3/4,137-161(1991;兹伯利0756.93087)](参见S.Peng先生[SIAM J.控制优化28,No.4,966-979(1990;Zbl 0712.93067号)])提供了。在类似于确定性情况的假设下,该条件也就足够了(参见第二作者的出版物[IEEE.Trans.Autom.Control 41,No.8,1176-1179(1996;Zbl 0857.93099号)]). 本章以具有状态约束的随机系统的最大值原理结束。
第四章研究动态规划方法。如前所述,首先通过Bellman原理和Hamilton-Jacobi方程描述确定性情况。粘度解是允许非光滑(但在本书中是连续的)解的泛化。讨论了它们的存在性和唯一性。在随机环境中进行并行开发,并提供了值函数的特性。本章中的一些证明相当技术性。
第五章“是整本书的核心”,汇集了前两章开发的工具,即大致而言,最优性的必要条件和充分条件。从分析力学的经典Hamilton-Jacobi理论开始,其中Hamiltonian动力学从Hamilton-Jacobi方程的假定光滑解(V)恢复,并且在局部逆解成立的情况下,当存在控制时,会出现类似的情况。在这两种情况下,等价性来源于通过粘度解将伴随变量表示为\(p={偏V\ over\偏x})或非光滑形式的可能性。接下来是随机泛化的发展。正如第四章所指出的,必须使用扩展的哈密顿量,哈密顿-雅可比方程包含额外的项,作者在光滑和非光滑情况下发展了一个理论。得出了最优反馈综合的结果。本章的哲学思想来源于第二作者(1988年)的论文。
第六章研究线性二次型最优控制问题。首先,回顾了经典的确定性案例。使用蛮力泛函分析方法和对成本的适当处理,可以将该问题重新表述为希尔伯特控制空间中的参数极小化;这里的参数是初始时间和状态向量。但解决方案涉及复杂算子的反演。这有助于通过最大值原则评估通用方法的有用性。该问题的答案通过著名的Riccati方程的解参数化,该方程也可以通过动态规划或使用“平方补全”方法获得。其次,说明了弱形式中的随机LQ问题。成本是\[J(s,y,u(.))=E\Biggl(int^T_s[(Qx,x)+2(sx,u)+(Ru,u)]dt+\textstyle{1\over 2}}\显示样式{(G(x(T),x(T\]约束条件是SDE:\[dx=[A(t)x+B(t)u+B(t)]dt+[C(t)x+D(t)u+\西格玛(t)]dW\]其中\(x(s)=y\)\(Q(t)、(R(t))、(G(t)对称,大小合适,但不一定确定。这种情况是在多目标背景下出现的。扩散依赖于控制,决策可能会增加波动性和风险。在多目标情况下,这导致了一个有意义的权衡:控制能量必须增加才能实现某个目标,但由于漂移,风险增加,一个人可能会面临无法实现另一个目标的风险。通过与先前的参数最小化方法类似的方法来表征该问题的解的存在性。接下来,应用第三章的结果介绍了哈密顿系统,并导出了导致控制解的最优性必要条件。它可以通过称为“随机Riccati方程”的Riccati型方程的解重新表示和参数化:\[\点P+PA+A^t P+C^t PC+Q=\Lambda^t(R+D^t PD)^{-1}\Lambda,\]
\[\兰姆达=B^t P+S+D^t PC\]和(P(T)=G),(R+D^tPD>0)。该方程也可以通过动态规划或“平方补齐”方法获得。在作者和其他研究人员的研究之后,接下来将在某些情况下研究其全局可解性。最后一节考虑均值-方差投资组合选择问题,该问题说明了上述权衡。
最后一章致力于研究BSDEs。它们是随机最大值原理中伴随变量的演化方程。在线性和非线性情况下定义了自适应解。给出了它们存在唯一的条件,并用泛函分析方法进行了证明。BSDE可用作通过Feynman-Kac型公式表示某些偏微分方程(通常为Hamilton-Jacobi方程)的解的一种方法。另一部分涉及前后SDE和相关的“四步方案”。这适用于一些期权定价问题。
超过三十页的参考文献(!)和索引结束了这本写得很好的书。很好的例子和激励性的应用(主要来自经济学和金融学;Markowitz、Black和Scholes的诺贝尔奖获奖贡献是正确的)可以在文本中找到。本章以非常有价值的历史信息结束,这些信息涉及所处理主题的出现和演变。这里引用了参考书目。
作者成功地展示了最优性的必要条件和充分条件之间的相互作用,指出了等价性成立的时间和原因(第二、三、四章)。第五章重点讨论了一个特殊的案例,再次提出了这一观点。在这些章节中,作者从更简单的确定性情况开始,然后推广到随机情况。这允许指出差异,但主要方法保持平行。这就提供了一个统一的观点。这些章节描述了随机控制本身,而第一章和最后一章通过介绍使卷内容完备并通过高级技术方面涉及随机分析。因此,一个人在经历了优化世界(丰富了优化世界)之后,又回到了最初的“随机水域”。这本优秀而精湛的书以和谐而结构化的方式统一了随机最优控制的构建块,同时契合了作者的重要贡献。
如果评论员必须买一本关于随机控制的书,那就是这本。

MSC公司:

93-02 与系统和控制理论相关的研究展览(专著、调查文章)
93E20型 最优随机控制
第49页第25页 最优控制和微分对策中Hamilton-Jacobi方程的粘性解
91G80型 其他理论的金融应用
49升20 最优控制与微分对策中的动态规划
49甲10 线性二次型最优控制问题
49J55型 随机性问题最优解的存在性
49公里45 随机问题的最优性条件
60G35型 信号检测和滤波(随机过程方面)
60 H10型 随机常微分方程(随机分析方面)
PDF格式BibTeX公司 XML格式引用