×

随机控制的可计算原界和对偶界。 (英语) Zbl 1454.93295号

摘要:我们研究了一个退出时间随机控制问题的线性规划框架,并应用平方矩层次来获得值函数的紧点态边界和全局边界函数。通过分别以矩和平方和多项式表示为目标的半定程序,数值实现了适当测度上的原线性程序和测试函数上的对偶线性程序。在适当的技术条件下,随着多项式次数增加到无穷大,数值优化的边界从下面收敛到值函数。我们关注对偶问题,它特别有效,因为它的单个实现在整个问题域上产生一个多项式边界函数,并且由于它允许灵活选择目标函数,因此可以改进感兴趣区域的全局边界。

MSC公司:

93E20型 最优随机控制
93C20美元 偏微分方程控制/观测系统
90C05(二氧化碳) 线性规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] E.Anderson和P.Nash,《无限维空间中的线性规划:理论和应用》,John Wiley&Sons,Chichester,英国,1987年·Zbl 0632.90038号
[2] G.Barles和E.Jakobsen,Hamilton-Jacobi-Bellman方程单调逼近格式的误差界,SIAM J.Numer。分析。,43(2005),第540-558页·兹比尔1092.65077
[3] A.Bhatt和V.Borkar,受控马尔可夫过程的占用测度:表征和优化,Ann.Probab。,24(1996),第1531-1562页·兹伯利0863.93086
[4] P.Bilingsley,《概率测度的收敛》,第二版,John Wiley&Sons,纽约,1999年·Zbl 0944.60003号
[5] R.Buckdahn、D.Goreac和M.Quincampoix,随机最优控制和线性规划方法,应用。数学。最佳。,63(2011),第257-276页·Zbl 1226.93137号
[6] M.Cho和R.Stockbridge,最优停止问题的线性规划公式,SIAM J.控制优化。,40(2002),第1965-1982页·Zbl 1010.60037号
[7] M.Claeys、J.Daafouz和D.Henrion,非线性切换系统控制的模态占用测度和LMI松弛,Automatica J.IFAC,64(2016),第143-154页·Zbl 1329.49051号
[8] J.Diestel,《巴拿赫空间中的序列和级数》,Springer-Verlag,纽约,1984年·Zbl 0542.46007号
[9] H.Dong和N.Krylov,关于区域中的时间非均匀受控扩散过程,Ann.Probab。,35(2007),第206-227页·Zbl 1127.93062号
[10] W.Fleming和H.Soner,受控马尔可夫过程和粘度解,第二版,Springer-Verlag,纽约,2006年·Zbl 1105.60005号
[11] W.Fleming和D.Vermes,扩散最优控制的凸对偶方法,SIAM J.控制优化。,27(1989),第1136-1155页·Zbl 0693.93082号
[12] V.Gaitsgory和M.Quincampoix,带折扣的确定性无限期最优控制问题的线性规划方法,SIAM J.控制优化。,48(2009),第2480-2512页·兹比尔1201.49040
[13] E.Gobet和R.Munos,使用Itô-Malliavin演算和鞅的灵敏度分析,以及在随机最优控制中的应用,SIAM J.控制优化。,43(2005),第1676-1713页·Zbl 1116.60033号
[14] D.Goreac和O.Serea,Mayer和不连续费用最优停止随机控制问题,J.Math。分析。申请。,380(2011),第327-342页·Zbl 1215.93150号
[15] D.Henrion、J.Lasserre和J.Lo¨fberg,《GloptiPoly 3:矩、优化和半定规划》,Optim。方法软件。,24(2009),第761-779页·Zbl 1178.90277号
[16] D.Henrion和E.Pauwels,非线性最优控制的圆锥线性优化,《工程应用优化的进展和趋势》,T.Terlaky、M.Anjos和S.Ahmed编辑,SIAM,费城,2017年,第10章,第121-133页。
[17] H.Kappen和H.Ruiz,控制和推理的自适应重要性采样,J.Stat.Phys。,162(2016),第1244-1266页·Zbl 1338.93166号
[18] K.Kashima和R.Kawai,通过回火多项式优化实现随机微分方程的弱近似,Stoch。《模型》,27(2011),第26-49页·兹比尔1305.60044
[19] K.Kashima和R.Kawai,《利用数学规划通过硬边界对随机微分方程进行弱逼近》,SIAM J.Sci。计算。,35(2013),第A1-A21页·Zbl 1264.60038号
[20] R.Kawai,椭圆偏微分方程边值问题的显式硬边界函数,计算。数学。申请。,70(2015),第2822-2837页·Zbl 1443.35030号
[21] M.Korda、D.Henrion和C.Jones,非线性动力系统的控制器设计和值函数逼近,Automatica J.IFAC,67(2016),第54-66页·Zbl 1335.49050号
[22] N.Krylov,二阶非线性椭圆和抛物方程,D.Reidel,Dordrecht,荷兰,1987年·Zbl 0619.35004号
[23] N.Krylov,关于变系数Bellmans方程有限差分近似的收敛速度,Probab。理论相关领域,117(2000),第1-16页·Zbl 0971.65081号
[24] T.Kurtz和R.Stockbridge,Markov控制的存在性和最优Markov控制特征。,SIAM J.控制优化。,36(1998年),第609-653页·Zbl 0935.93064号
[25] H.Kushner和P.Dupuis,连续时间随机控制问题的数值方法,第二版,Springer-Verlag,纽约,2001年·Zbl 0968.93005号
[26] J.Lasserre,《矩、正多项式及其应用》,帝国理工学院出版社,伦敦,2010年·Zbl 1211.90007号
[27] J.Lasserre、D.Henrion、C.Prieur和E.Treílat,通过占用测度和LMI松弛实现非线性最优控制,SIAM J.control Optim。,47(2008),第1643-1666页·兹比尔1188.90193
[28] M.Laurent,《平方和、矩矩阵和多项式优化》,载于《代数几何的新兴应用》,M.Putinar和S.Sullivant主编,Springer,纽约,2009年,第157-270页·Zbl 1163.13021号
[29] J.Loífberg,YALMIP:MATLAB中建模和优化的工具箱,2004年IEEE机器人与自动化国际会议,路易斯安那州新奥尔良,2004年,第284-289页。
[30] A.Majumdar、R.Vasudevan、M.Tobenkin和R.Tedrake,通过占用度量对非线性反馈控制器进行凸优化,国际机器人杂志。Res.,33(2014),第1209-1230页。
[31] M.Marshall,《正多项式和平方和》,美国数学学会,普罗维登斯,RI,2008年·Zbl 1169.13001号
[32] E.McShane,函数范围的扩展,布尔。阿默尔。数学。《社会学杂志》,40(1934),第837-842页·JFM 60.0973.02标准
[33] MOSEK ApS,MATLAB手册的MOSEK优化工具箱。2019年第9.0版,http://docs.mosek.com/9.0/toolbox/index.html。
[34] J.Nie和M.Schweighofer,《论普蒂纳积极的复杂性》,J.complexity,23(2007),第135-150页·Zbl 1143.13028号
[35] M.Putinar,紧半代数集上的正多项式,印第安纳大学数学系。J.,42(1993),第969-984页·兹比尔0796.12002
[36] H.Royden和P.Fitzpatrick,《真实分析》,第4版,培生教育亚洲有限公司和中国机械工业出版社,北京,2010年·Zbl 1191.26002号
[37] R.Serrano,关于跳跃扩散最优控制问题测度空间中的LP公式,系统。控制信函。,85(2015),第33-36页·Zbl 1322.93106号
[38] Q.Song,G.Yin,Z.Z.Zhang,受控区域切换扩散和区域切换跳跃扩散的数值方法,Automatica J.IFAC,42(2006),第1147-1157页·Zbl 1117.93370号
[39] A.Veretennikov和E.Veretennickov,关于多元Bernstein多项式的偏导数,Sib。高级数学。,26(2016),第294-305页·Zbl 1153.62016年
[40] R.Vinter,凸对偶与非线性最优控制,SIAM J.控制优化。,31(1993),第518-538页·Zbl 0781.49012号
[41] H.Whitney,区域边界上的可微函数,Ann.Math。,35(1934年),第482-485页·JFM 60.0217.03标准
[42] W.Whitt,函数空间上概率测度的弱收敛性,《数学统计年鉴》,41(1970),第939-944页·Zbl 0203.50501号
[43] J.Yong和X.Zhou,《随机控制:哈密顿系统和HJB方程》,Springer-Verlag出版社,纽约,1999年·Zbl 0943.93002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。