×

基于偏微分方程的微分对策的数值方法。 (英语) Zbl 1274.91069号

摘要:我们给出了求解两人零和确定性微分对策的一些数值方法。这些方法基于动态规划方法。我们首先求解与博弈相关的Isaacs方程以获得近似值函数,然后用它重建近似最优反馈控制和最优轨迹。近似方案也有一个有趣的控制解释,因为时间离散方案源于相关离散时间动态系统的动态规划原理。粘度解理论是将结果收敛到值函数的一般框架。对一些经典的追踪-扩散博弈进行了数值实验。

MSC公司:

91A23型 微分对策(博弈论方面)
91-08 博弈论、经济学和金融相关问题的计算方法
91A05型 2人游戏
65个M12 含偏微分方程初值和初边值问题数值方法的稳定性和收敛性
49N25号 脉冲最优控制问题
49升20 最优控制与微分对策中的动态规划
91A24型 位置游戏(追击和躲避等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aubin J.P.,生存理论(1992)
[2] Alziary de Roquefort B.,RAIRO数学。模型。数字。分析。第25页,第517页–·Zbl 0734.90131号 ·doi:10.1051/m2/1991 250505171
[3] Alziary de Roquefort B.,RAIRO数学。模型。数字。分析。第25页,第535页–
[4] 内政部:10.1142/S0218202594000492·Zbl 0860.93007号 ·doi:10.1142/S0218202594000492
[5] Bardi M.,SIAM J.控制优化。第26页,776页–
[6] DOI:10.1007/978-1-4612-4274-1_14·doi:10.1007/978-1-4612-4274-1_14
[7] 内政部:10.1007/978-0-8176-4755-1·doi:10.1007/978-0-8176-4755-1
[8] 内政部:10.1137/0328053·Zbl 0723.49024号 ·数字对象标识代码:10.1137/0328053
[9] DOI:10.1007/BFb0120033·doi:10.1007/BFb0120033
[10] DOI:10.1007/978-1-4612-0245-5_5·doi:10.1007/978-1-4612-0245-55
[11] M.Bardi、M Falcone和P.Soravia,《随机和微分游戏:理论和数值方法》,《国际微分游戏学会年鉴》4,编辑M.Bardy、T.Parthasarathy和T.E.S.Raghavan(Birkhäuser,波士顿,2000)pp。289–303.
[12] Bardi M.,离散Contin。发电机。系统6第361页–
[13] Bardi M.,《国际差分博弈学会年鉴》,载《随机和差分博弈:理论和数值方法》(2000年)
[14] 内政部:10.1007/BFb0004263·doi:10.1007/BFb0004263
[15] 内政部:10.1090/S0002-9947-1991-0991958-X·doi:10.1090/S0002-9947-1991-0991958-X
[16] Bardi M.,控制与信息科学讲座笔记156 pp 131–(1991)·doi:10.1007/BFb0040234
[17] DOI:10.1016/0362-546X(93)90098-D·Zbl 0816.35081号 ·doi:10.1016/0362-546X(93)90098-D
[18] Barles G.,《哈密尔顿-雅各比方程的粘性解》,《数学与应用》(1994)·兹伯利0819.35002
[19] Barles G.,RAIRO模型。数学。分析。第21页,第557页
[20] Barles G.,《无症状肛门》。第271页,共4页
[21] DOI:10.1016/0362-546X(90)90113-U·Zbl 0708.90104号 ·doi:10.1016/0362-546X(90)90113-U
[22] 内政部:10.1016/0022-0396(84)90040-8·Zbl 0548.90104号 ·doi:10.1016/0022-0396(84)90040-8
[23] DOI:10.1090/S0002-9939-1991-10 76572-8·doi:10.1090/S0002-9939-1991-1076572-8
[24] Basar T.,动态非合作博弈论(1982)·Zbl 0479.90085号
[25] DOI:10.1007/BFb0004261·doi:10.1007/BFb0004261
[26] Bertsekas D.P.,《动态规划》。确定性和随机模型(1987)
[27] Bertsekas D.P.,科学与工程数学139,收录于:随机最优控制。离散时间案例(1978年)
[28] 内政部:10.1007/BF01448394·Zbl 0582.49019号 ·doi:10.1007/BF01448394
[29] Capuzzo Dolcetta I.,Ann.Inst.H.PoincaréAnal公司。非线性第161页–
[30] DOI:10.1007/978-1-4612-1592-9_4·doi:10.1007/978-1-4612-1592-94
[31] DOI:10.1023/A:1008774508738·Zbl 0988.49016号 ·doi:10.1023/A:1008774508738
[32] 内政部:10.1090/S0002-9947-1984-0732102-X·doi:10.1090/S0002-9947-1984-0732102-X
[33] DOI:10.1090/S0273-0979-1992-00266-5·Zbl 0755.35015号 ·doi:10.1090/S0273-0979-1992-00266-5
[34] 内政部:10.1090/S0002-9947-1983-0690039-8·doi:10.1090/S0002-9947-1983-0690039-8
[35] 内政部:10.1090/S0025-5718-1984-0744921-8·兹伯利0557.65066 ·doi:10.1090/S0025-5718-1984-0744921-8
[36] Elliott R.J.,成员。阿默尔。数学。社会126
[37] DOI:10.1007/BF01168747·兹伯利0559.35013 ·doi:10.1007/BF01168747
[38] 内政部:10.1512/iumj.1984.33.33040·Zbl 1169.91317号 ·doi:10.1512/iumj.1984.33.33040
[39] Falcone M.,Hamilton-Jacobi-Bellman方程的最优控制和粘度解(1997)
[40] M.Falcone,最优控制和偏微分方程,编辑J.L.Menaldi,E.Rofman和A.Sulem(IOS出版社,2001)pp。456–465.
[41] DOI:10.1007/978-1-4612-0155-7_13·doi:10.1007/978-1-4612-0155-7_13
[42] M.Falcone和P.Stefani,《动态游戏的进展》,《国际差分游戏学会年鉴》,编辑A.S.Nowak和K.Szajowski(Birkhäuser,2002)pp。515–544. ·Zbl 1123.91007号
[43] 内政部:10.1137/S0036142901388378·Zbl 1043.65106号 ·doi:10.1137/S0036142901388378
[44] Fleming W.H.,控制与信息科学课堂讲稿184 pp 185–(1992)·doi:10.1007/BFb0113240
[45] 内政部:10.1007/978-1-4612-6380-7·doi:10.1007/978-1-4612-6380-7
[46] Fleming W.H.,受控马尔可夫过程和粘度解(1993)·Zbl 0773.60070号
[47] 内政部:10.1512/iumj.1989.38.38015·Zbl 0686.90049号 ·doi:10.1512/iumj.1989.38.38015
[48] 内政部:10.1137/0331016·Zbl 0796.49024号 ·doi:10.1137/0331016
[49] Isaacs R.,差异游戏(1965)
[50] 石井H.,Ann.Sc.Norm。Sup.Pisa(IV)16第105页–
[51] 内政部:10.1007/978-1-4612-3716-7·doi:10.1007/978-1-4612-3716-7
[52] DOI:10.1007/978-3-0348-8802-8_28·doi:10.1007/978-3-0348-8802-8_28
[53] 内政部:10.1007/978-1-4612-4274-1_8·doi:10.1007/978-1-4612-4274-18
[54] 内政部:10.1007/PL00005430·doi:10.1007/PL00005430文件
[55] Lions P.L.,Hamilton-Jacobi方程的广义解(1982)·Zbl 0497.35001号
[56] 内政部:10.1137/0323036·Zbl 0569.49019号 ·doi:10.1137/0323036
[57] 内政部:10.1137/0324065·Zbl 0628.90106号 ·doi:10.1137/0324065
[58] Patsko V.S.,《俄罗斯科学院科学报告》(2000年)
[59] 内政部:10.1007/978-3-0348-8497-6_4·doi:10.1007/978-3-0348-8497-64
[60] DOI:10.1287/门4.1.60·Zbl 0411.90072号 ·doi:10.1287/门4.1.60
[61] Quarteroni A.,偏微分方程的区域分解方法(1999)·Zbl 0931.65118号
[62] Soravia P.,微分积分方程5,pp 1049–·Zbl 0758.9003号
[63] 内政部:10.1080/03605309308820983·Zbl 0788.49028号 ·doi:10.1080/036053093088203
[64] 内政部:10.1137/0331027·Zbl 0786.35018号 ·doi:10.1137/0331027
[65] 内政部:10.1137/S0363012995291865·Zbl 0947.65077号 ·doi:10.1137/S0363012995291865
[66] Strikwerda J.C.,偏微分方程的有限差分格式(1989)·Zbl 0681.65064号
[67] 内政部:10.1016/0362-546X(85)90062-8·Zbl 0526.35018号 ·doi:10.1016/0362-546X(85)90062-8
[68] Subbotin A.I.,苏联数学。多克。第22页,第358页–
[69] 文件编号:10.1007/BF00934749·Zbl 0517.90100号 ·doi:10.1007/BF00934749
[70] DOI:10.1016/0362-546X(91)90175-Z·Zbl 0739.35011号 ·doi:10.1016/0362-546X(91)90175-Z
[71] Subbotin A.I.,Hamilton-Jacobi方程的Minimax和粘度解(1991)·Zbl 0733.70014号
[72] Subbotin A.I.,俄罗斯J.Numer。分析。数学。建模8 pp 145–
[73] 内政部:10.1007/978-1-4612-0847-1·doi:10.1007/978-1-4612-0847-1
[74] Subbotin A.I.,问题。控制信息理论15第451页–
[75] DOI:10.1023/A:1018998817584·Zbl 0930.49017号 ·doi:10.1023/A:1018998817584
[76] Tarasyev A.M.,J.计算。系统科学。国际。第33页,第127页
[77] 数字对象标识码:10.1137/S036301299325534X·Zbl 0845.90135号 ·doi:10.1137/S036301299325534X
[78] DOI:10.1007/978-1-4612-0245-5_6·doi:10.1007/978-1-4612-0245-56
[79] M.M.Tidball和R.L.V.Gonzalez,《系统建模与优化》(苏黎世,1991年),《控制与信息讲义》。科学。180(施普林格,柏林)pp。35-44之间。
[80] 内政部:10.1137/S0363012994272460·Zbl 0899.90178号 ·doi:10.1137/S0363012994272460
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。