×

时滞连续随机系统最优控制的时间离散化和收敛速度。 (英语) Zbl 1211.65077号

摘要:我们研究了随机最优控制问题的半离散化方案,其动力学由具有有界记忆的受控随机时滞(或泛函)微分方程给出。绩效以预期成本衡量。通过两步离散时间,我们构造了一个离散时间内有限维马尔可夫最优控制问题的近似序列。相应的值函数收敛到原问题的值函数,我们导出了离散化误差的上界,或者等价地,导出了收敛速度的最坏情况估计。

理学硕士:

65K10码 数值优化和变分技术
49J55型 随机性问题最优解的存在性
65立方米 随机微分和积分方程的数值解
93E20型 最优随机控制
60华氏35 随机方程的计算方法(随机分析方面)
07年6月60日 随机变分法和Malliavin演算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Atkinson,K.,Han,W.:理论数值分析。《应用数学教科书》,第39卷。施普林格,纽约(2001)
[2] Barles,G.,Jakobsen,E.R.:Hamilton-Jacobi-Bellman方程单调近似方案的误差界。SIAM J.数字。分析。43(2), 540–558 (2005) ·Zbl 1092.65077号 ·doi:10.1137/S003614290343815X
[3] Barles,G.,Jakobsen,E.R.:抛物Hamilton-Jacobi-Bellman方程单调逼近格式的误差界。数学。计算。76(260), 1861–1893 (2007) ·Zbl 1123.65096号 ·doi:10.1090/S0025-5718-07-02000-5
[4] Bauer,H.,Rieder,U.:时滞随机控制问题。数学。方法。操作。第62(3)号决议,411-427(2005)·Zbl 1098.93034号 ·doi:10.1007/s00186-005-0042-4
[5] Buckwar,E.:随机时滞微分方程数值分析导论。J.计算。申请。数学。125(1–2), 297–307 (2000) ·Zbl 0971.65004号 ·doi:10.1016/S0377-0427(00)00475-1
[6] Calzolari,A.,Florchinger,P.,Nappo,G.:随机时滞系统非线性滤波的收敛性。SIAM J.控制优化。(出现)·Zbl 1152.60035号
[7] Chang,M.-H.,Pang,T.,Pemy,M.:具有有限记忆的随机泛函微分方程的最优控制。收录于:张,X.,刘,D.,吴,L.(编辑)《运筹学及其应用》,第六届国际研讨会论文,ISORA’06,中国新疆,8月8-12日,第82-94页。世界出版公司,北京(2006)
[8] Elsanosi,I.,Øksendal,B.,Sulem,A.:一些可解的时滞随机控制问题。斯托奇。斯托奇。代表71(1-2)、69–89(2000)·Zbl 0999.93072号
[9] Falcone,M.,Ferretti,R.:Hamilton-Jacobi-Bellman方程粘性解的离散时间高阶格式。数字。数学。67(3), 315–344 (1994) ·Zbl 0791.65046号 ·doi:10.1007/s002110050031
[10] Falcone,M.,Rosace,R.:时滞方程最优控制问题的离散时间近似。控制网络。25(3), 665–675 (1996) ·Zbl 0855.49004号
[11] Fischer,M.,Reiß,M.:具有延迟的连续时间动力学的随机控制问题的离散化。J.计算。申请。数学。205(2), 969–981 (2007) ·Zbl 1123.93088号 ·doi:10.1016/j.cam.2006.02.062
[12] Garsia,A.M.,Rodemich,E.,Rumsey,H.Jr.:实变量引理和一些高斯过程的路径连续性。印第安纳州数学。J.20(6),565–578(1970)·Zbl 0252.60020号 ·doi:10.1512/iumj.1970.20046
[13] Gihman,I.I.,Skorohod,A.V.:受控随机过程。施普林格,纽约(1979年)·Zbl 0404.60061号
[14] Hu,Y.,Mohammed,S.-E.A.,Yan,F.:随机时滞方程的离散时间近似:Milstein格式。安·普罗巴伯。32(1A),265–314(2004)·Zbl 1066.60096号 ·doi:10.1214/009117904000000829
[15] Karatzas,I.,Shreve,S.E.:布朗运动与随机微积分,第二版。数学研究生教材,第113卷。施普林格,纽约(1991)·Zbl 0734.60060号
[16] Krylov,N.V.:受控扩散过程。数学应用,第14卷。施普林格,纽约(1980)·Zbl 0436.93055号
[17] Krylov,N.V.:使用分段常数策略近似受控退化扩散过程的值函数。电子。J.概率。4, 1–19 (1999) ·Zbl 1044.93546号
[18] Krylov,N.V.:关于变系数Bellman方程有限差分近似的收敛速度。普罗巴伯。理论关联。字段117(1),1-16(2000)·Zbl 0971.65081号 ·doi:10.1007/s004400050264
[19] Krylov,N.V.:随机积分的中值定理。安·普罗巴伯。29(1), 385–410 (2001) ·Zbl 1021.60042号 ·doi:10.1214/aop/1008956335
[20] Kushner,H.J.:具有时滞的非线性随机系统的数值近似。随机77(3),211-240(2005)·Zbl 1140.93497号
[21] Kushner,H.J.:状态和控制时滞随机系统的数值近似。Lefschetz动力系统中心技术报告(2005年)·Zbl 1140.93497号
[22] Kushner,H.J.,Dupuis,P.:连续时间随机控制问题的数值方法,第2版。数学应用,第24卷。施普林格,纽约(2001)·Zbl 0968.93005号
[23] Larssen,B.:时滞系统随机控制中的动态规划。斯托奇。斯托奇。代表74(3-4),651-673(2002)·Zbl 1022.34075号
[24] Larssen,B.,Risebro,N.H.:随机时滞方程控制问题的HJB-方程何时为有限维?斯托奇。分析。申请。21(3), 643–671 (2003) ·Zbl 1052.60051号 ·doi:10.1081/SAP-12000430
[25] Mao,X.:随机泛函微分方程的数值解。LMS J.计算。数学。6141-161(2003年)·Zbl 1055.65011号
[26] Mohammed,S.-EA.:随机泛函微分方程。皮特曼,伦敦(1984)·Zbl 0584.60066号
[27] Øksendal,B.,Sulem,A.:具有时滞的随机系统最优控制的最大值原理,及其在金融中的应用。收录于:Menaldi,J.、Rofman,E.、Sulem,A.(编辑)《最优控制与偏微分方程》。为纪念阿兰·本苏桑教授60岁生日。会议记录,巴黎,2000年12月4日,第64-79页。IOS出版社,阿姆斯特丹(2001)·Zbl 1054.93531号
[28] 罗杰斯,L.C.G.:路径随机最优控制。SIAM J.控制优化。46(3), 1116–1132 (2007) ·Zbl 1155.90019号 ·doi:10.1137/050642885
[29] Słomiáski,L.:具有反射边界的SDE解的欧拉近似。斯托奇。过程。申请。94, 317–337 (2001) ·Zbl 1053.60062号 ·doi:10.1016/S0304-4149(01)00087-4
[30] Stroock,D.W.,Varadhan,S.R.S.:多维扩散过程。Grundlehren der Mathematischen Wissenschaften,第233卷。柏林施普林格(1979)·Zbl 0426.60069号
[31] Yong,J.,Zhou,X.Y.:随机控制。哈密顿系统和HJB方程。数学应用,第43卷。纽约施普林格出版社(1999年)·Zbl 0943.93002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。