×

随机微分对策:通过FBSDE的抽样方法。 (英语) Zbl 1429.91035号

摘要:本文的目的是提出一种基于抽样的算法,用于求解各类随机微分对策。该方法的基础在于根据一对解耦的正向和反向随机微分方程(FBSDE)来制定博弈解。根据非线性版本的Feynman-Kac引理,得到了每类非线性Hamilton-Jacobi-Isaacs方程解的概率表示。这些表示形式为FBSDE的解耦系统,可通过数值求解。

MSC公司:

91A15型 随机对策,随机微分对策
60 H10型 随机常微分方程(随机分析方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Athans M,Falb P(2007)最优控制——理论及其应用简介。多佛出版公司,纽约
[2] Barles G,Souganidis P(1991)完全非线性二阶方程近似格式的收敛性。渐近分析4(3):271-283·兹比尔0729.65077
[3] Beard R,Saridis G,Wen J(1997)广义Hamilton-Jacobi-Bellman方程的Galerkin近似。Automatica 33(12):2159-2177·Zbl 0949.93022号 ·doi:10.1016/S0005-1098(97)00128-3
[4] Bender C,Denk R(2007)向后SDE的正向方案。Stoch过程应用117:1793-1812·Zbl 1131.60054号 ·doi:10.1016/j.spa.2007.03.005
[5] Berkovitz L(1961)微分对策的变分方法。兰德公司报告·Zbl 0138.16603号
[6] Bouchard B,Touzi N(2004)BSDE的离散时间近似和蒙特卡罗模拟。Stoch过程应用111:175-206·Zbl 1071.60059号 ·doi:10.1016/j.spa.2004.01.001
[7] Bouchard B,Elie R,Touzi N(2009)BSDE的离散时间近似和完全非线性偏微分方程的概率方案。氡系列计算机应用数学8:91-124·Zbl 1179.65004号
[8] Buckdahn R,Li J(2008)随机微分对策与Hamilton-Jacobi-Bellman-Isaacs方程的粘性解。SIAM J控制优化47(1):444-475·Zbl 1157.93040号 ·doi:10.1137/060671954
[9] Chassagneux JF,Richou A(2016)二次BSDEs的数值模拟。《Ann Appl Probab》26(1):262-304·Zbl 1334.60129号 ·doi:10.1214/14-AAP1090
[10] Da Lio F,Ley O(2006)二阶Bellman-Isaacs方程在二次增长假设和应用下的唯一性结果。SIAM J控制优化45(1):74-106·Zbl 1116.49017号 ·doi:10.1137/S0363012904440897
[11] Delbaen F,Hu Y,Richou A(2011)关于具有凸生成元和无界终端条件的二次BSDE解的唯一性。《亨利·庞加莱研究所年鉴》,概率与统计47(2):559-574·Zbl 1225.60093号 ·doi:10.1214/10-AIHP372
[12] Dixon M、Edelbaum T、Potter J、Vandervelde W(1970)轴对称航天器的燃料最优再定向。太空人火箭杂志7(11):1345-1351·数字标识代码:10.2514/3.30168
[13] Douglas J,Ma J,Protter P(1996)正反随机微分方程的数值方法。《Ann Appl Probab》6:940-968·Zbl 0861.65131号 ·doi:10.1214/aoap/1034968235
[14] Duncan T,Pasik-Duncan B(2015)一些含状态相关噪声的随机微分对策。参加:第54届IEEE决策与控制会议,日本大阪,12月15-18日·Zbl 1346.91012号
[15] Dvijotham K,Todorov E(2013)线性可解最优控制。参见:Lewis FL,Liu D(编辑)反馈控制的强化学习和近似动态规划,第119-141页。https://doi.org/10.1002/9781118453988.ch6
[16] El Karoui N,Peng S,Queez MC(1997)《金融中的倒向随机微分方程》。数学金融7:1-71·Zbl 0884.90035号 ·doi:10.1111/1467-9965.00022
[17] Exarchos I,Theodorou E(2018)通过正向和反向随机微分方程和重要性抽样实现随机最优控制。自动化87:159-165·Zbl 1378.93144号 ·doi:10.1016/j.autotica.2017年9月17日
[18] Fahim A,Touzi N,Warin X(2011)完全非线性抛物偏微分方程的概率数值方法。《Ann Appl Probab》21(4):1322-1364·Zbl 1230.65009号 ·doi:10.1214/10-AAP723
[19] Fleming W,Soner H(2006)《受控马尔可夫过程和粘度解》,第2版。随机建模和应用概率。柏林施普林格·Zbl 1105.60005号
[20] Fleming W,Souganidis P(1989)关于二人零和随机微分对策值函数的存在性。印第安纳大学数学杂志,纽约·Zbl 0686.90049号
[21] Gobet E,Labart C(2007)反向随机微分方程离散化的误差扩展。Stoch过程应用117:803-829·Zbl 1117.60058号 ·doi:10.1016/j.spa.2006.10.007
[22] Gorodetsky A,Karaman S,Marzouk Y(2015)使用张量-应变分解的高效高维随机最优运动控制。主题:机器人:科学与系统(RSS)
[23] Györfi L,Kohler M,Krzyzak A,Walk H(2002)非参数回归的无分布理论。统计学中的斯普林格系列。纽约州施普林格·Zbl 1021.62024号 ·数字对象标识代码:10.1007/b97848
[24] Hamadene S,Lepeltier JP(1995)零和随机微分对策和后向方程。系统控制快报24:259-263·Zbl 0877.93125号 ·doi:10.1016/0167-6911(94)00011-J
[25] Ho Y,Bryson A,Baron S(1965)微分对策与最优追求扩张策略。IEEE Trans自动控制10:385-389·doi:10.1109/TAC.1965.1098197
[26] Horowitz MB,Burdick JW(2014),随机最优控制策略的半定松弛。收件人:波特兰美国控制会议,6月4-6日,3006-2012
[27] Horowitz MB,Damle A,Burdick JW(2014)高维线性Hamilton-Jacobi-Bellman方程。参加:第53届IEEE决策与控制会议,12月15日至17日,美国加利福尼亚州洛杉矶
[28] Isaacs R(1965)微分对策:一种应用于战争、追击、控制和优化的数学理论。威利,纽约·Zbl 0125.38001号
[29] Kappen HJ(2005)非线性随机系统控制的线性理论。Phys修订版Lett 95:200201·doi:10.1103/PhysRevLett.95.200201
[30] Karatzas I,Shreve S(1991)布朗运动与随机微积分,第2版。纽约州施普林格·Zbl 0734.60060号
[31] Kloeden P,Platen E(1999)随机微分方程的数值解,《数学应用、随机建模和应用概率》第23卷,第3版。柏林施普林格
[32] Kobylanski M(2000)倒向随机微分方程和二次增长偏微分方程。《Ann Probab》28(2):558-602。https://doi.org/10.1214/aop/1019160253 ·Zbl 1044.60045号 ·doi:10.1214/aop/1019160253
[33] Kushner H(2002)随机微分对策的数值逼近。SIAM J控制优化41:457-486·Zbl 1014.60035号 ·doi:10.1137/S0363012901389457
[34] Kushner H,Chamberlain S(1969)关于随机微分对策:给定策略是鞍点的充分条件,以及对策解的数值过程。数学分析应用杂志26:560-575·Zbl 0182.20802号 ·doi:10.1016/0022-247X(69)90199-1
[35] Lasserre JB、Henrion D、Prieur C、Trelat E(2008)《通过占用测度和LMI松弛的非线性最优控制》。SIAM J控制优化47(4):1643-1666·Zbl 1188.90193号 ·doi:10.1137/070685051
[36] Lemor JP,Gobet E,Warin X(2006)求解广义倒向随机微分方程的经验回归方法的收敛速度。伯努利12(5):889-916·兹比尔1136.60351 ·doi:10.3150/bj/1161614951
[37] Lepeltier JP,Martn JS(1998)具有超线性二次系数的BSDE的存在性。Stoch Int J Probab Stoch过程63(3-4):227-240·Zbl 0910.60046号
[38] Longstaff FA,Schwartz RS(2001)《通过模拟评估美国期权:简单的最小二乘法》。Rev Finance螺柱14:113-147·Zbl 1386.91144号 ·doi:10.1093/rfs/14.1.113
[39] 马J,永J(1999)前向随机微分方程及其应用。柏林施普林格·Zbl 0927.60004号
[40] Ma J,Protter P,Yong J(1994)显式求解前向随机微分方程——一个四步格式。概率论相关领域98:339-359·Zbl 0794.60056号 ·doi:10.1007/BF01192258
[41] Ma J,Shen J,Zhao Y(2008)关于前向-后向随机微分方程的数值近似。SIAM J数字分析46(5):2636-2661·兹比尔1177.60064 ·数字对象标识码:10.1137/06067393X
[42] McEneaney WM(2007)解某些HJB偏微分方程的无维数诅咒数值方法。SIAM J控制优化46(4):1239-1276·Zbl 1251.65168号 ·doi:10.1137/040610830
[43] Milstein GN,Tretyakov MV(2006)正向随机微分方程的数值算法。SIAM科学计算杂志28(2):561-582·Zbl 1114.60054号 ·doi:10.1137/040614426
[44] Morimoto J,Atkeson C(2002)Minimax微分动态规划:健壮两足步行的应用。In:神经信息处理系统进展,加拿大不列颠哥伦比亚省温哥华,12月9日至14日
[45] Morimoto J、Zeglin G、Atkeson C(2003)《Minimax微分动态规划:两足步行机器人的应用》。参加:IEEE/RSJ智能机器人和系统国际会议,内华达州拉斯维加斯,2:1927-1932,10月27-31日
[46] Nagahara M,Quevedo DE,NešićD(2016)最大动手控制:控制努力最小化的范例。IEEE Trans Autom Control 61(3):735-747·Zbl 1359.49005号 ·doi:10.1109/TAC.2015.2452831
[47] Nagahara M、Quevedo DE、NešićD(2013)最大动手控制和L1优化。In:第52届IEEE决策与控制会议,意大利佛罗伦萨,12月10日至13日,第3825-3830页
[48] Øksendal B(2007)《随机微分方程——应用简介》,第6版。柏林施普林格·兹比尔074760052
[49] Ramachandran KM,Tsokos CP(2012)随机微分对策。亚特兰蒂斯出版社,巴黎·Zbl 1250.91004号 ·doi:10.2991/978-94-91216-47-3
[50] Seywald H、Kumar RR、Deshpande SS、Heck ML(1994年)《最小燃料航天器重新定向》。制导控制动力学杂志17(1):21-29·Zbl 0788.49033号 ·doi:10.2514/3.21154
[51] Song Q,Yin G,Zhang Z(2008)具有状态切换的随机微分对策的数值解。IEEE Trans Autom控制53:509-521·Zbl 1367.91028号 ·doi:10.1109/TAC.2007.915169
[52] Sun W,Theodorou EA,Tsiotras P(2015),博弈论连续时间微分动态规划。收件人:美国控制会议,芝加哥,7月1-3日,第5593-5598页
[53] Theodorou EA,Buchli J,Schaal S(2010)强化学习的广义路径积分控制方法。J Mach学习研究11:3137-3181·兹比尔1242.68254
[54] Xiu D(2010)随机计算的数值方法——谱方法。普林斯顿大学出版社·Zbl 1210.65002号 ·doi:10.2307/j.ctv7h0skv
[55] Yong J,Zhou XY(1999)随机控制:哈密顿系统和HJB方程。纽约州施普林格·Zbl 0943.93002号 ·doi:10.1007/978-1-4612-1466-3
[56] Zhang J(2004)BSDEs的数值格式。Ann Appl Probab年鉴14(1):459-488·Zbl 1056.60067号 ·doi:10.1214/aoap/1075828058
[57] 张杰(2017)倒向随机微分方程。概率论和随机建模。柏林施普林格·Zbl 1390.60004号 ·doi:10.1007/978-1-4939-7256-2
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。