×

我、我和我:复杂智能体非马尔可夫时间不一致随机控制的一般理论。 (英语) Zbl 1525.60073号

摘要:我们发展了一个理论,用于解决固有时间不一致的连续时间非马尔可夫随机控制问题。它们的显著特点是经典的Bellman最优原理不再成立。我们的公式是在受控的非马尔可夫正向随机微分方程和一般目标函数设置的框架内进行的。我们采用游戏理论的方法来研究这些问题,这意味着我们寻求子博弈精炼纳什均衡点。作为这项工作的第一个新颖之处,我们引入并推动了对平衡定义的改进,使我们能够建立一个直接而严格的证明扩展动态规划原理以与经典理论相同的精神。这反过来又允许我们引入一个由类似于经典HJB方程的无限族倒向随机微分方程组成的系统。我们证明了这个系统是基本的,从这个意义上说,它的完备性对于刻画价值函数和均衡既是必要的也是充分的。作为最后一步,我们给出了一个存在唯一的结果。文中还给出了一些例子和结果的推广。

MSC公司:

60 H10型 随机常微分方程(随机分析方面)
60华氏30 随机分析的应用(PDE等)
60G07年 随机过程的一般理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴罗·R·J(1999)。拉姆齐与莱布森在新古典增长模型中相遇。Q.J.经济。114 1125-1152. ·Zbl 0940.91056号
[2] BASAK,S.和CHABAKAURI,G.(2010年)。动态均值-方差资产配置。财务版次。螺柱。23 2970-3016.
[3] BAYRAKTAR,E.、ZHANG,J.和ZHOU,Z.(2019)。关于连续时间中时间不一致停止问题的平衡概念。ArXiv预印ArXiv:1909.01112。
[4] BERTSEKAS,D.P.和SHREVE,S.E.(1978年)。随机最优控制:离散时间案例.科学与工程数学139.学术出版社[Harcourt Brace Jovanovich,出版商],纽约-朗顿·Zbl 0471.93002号
[5] BJRK,T.、KHAPKO,M.和MURGOCI,A.(2016年)。连续时间中的时间不一致随机控制:理论和实例。ArXiv预打印ArXiv:1612.03650·Zbl 1360.49013号
[6] BJRK,T.、KHAPKO,M.和MURGOCI,A.(2017年)。连续时间的时间不一致随机控制。财务统计。21 331-360之间·Zbl 1360.49013号 ·doi:10.1007/s00780-017-0327-5
[7] BJRK,T.和MURGOCI,A.(2010年)。马尔科夫时间不一致随机控制问题的一般理论。SSRN预印本1694759·Zbl 1297.49038号
[8] BJRK,T.和MURGOCI,A.(2014)。离散时间马尔可夫时间不一致随机控制理论。财务统计。18 545-592. ·Zbl 1297.49038号 ·doi:10.1007/s00780-014-0234-y
[9] BJRK,T.、MURGOCI,A.和ZHOU,X.Y.(2014)。具有状态相关风险规避的均值-方差投资组合优化。数学。财务24 1-24·Zbl 1285.91116号 ·网址:10.1111/j.1467-9965.2011.00515.x
[10] BOUCHARD,B.、POSSAMAÏ,D.、TAN,X.和ZHOU,C.(2018)。统一的方法先验的一般过滤中BSDEs超溶解度的估算。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。54 154-172之间·Zbl 1434.60134号 ·doi:10.1214/16-AIHP798
[11] BRUTSCHER,P.B.(2011)。付款重要吗?《预付费电能计量的探索性研究》,剑桥大学技术报告。
[12] CHRISTENSEN,S.和LINDENSJ,K.(2020年)。时间不一致停止、近视调整和平衡稳定性:应用平均方差。随机建模与控制.巴纳赫中心出版物。122 53-76. 波兰学院。科学。数学研究所。,华沙·Zbl 1460.60026号 ·doi:10.4064/bc122-4
[13] CHRISTENSEN,S.和LINDENSJ,K.(2020年)。关于时间不一致的停止问题和混合策略的停止时间。随机过程。申请。130 2886-2917. ·Zbl 1435.60029号 ·doi:10.1016/j.spa.2019.08.010
[14] 克里斯滕森,S.和LINDENSJÖ,K.(2022)。力矩约束最优股息:预先承诺和一致规划。申请中的预付款。普罗巴伯。54 404-432. ·Zbl 1494.91174号 ·doi:10.1017/apr.2021.38
[15] CLAISSE,J.、TALAY,D.和TAN,X.(2016)。受控扩散过程的伪马尔科夫性质。SIAM J.控制优化。54 1017-1029. ·兹比尔1341.60097 ·doi:10.1137/151004252
[16] CONT,R.和FOURNI,D.-A.(2010年)。路径空间上非预期泛函变量公式的变化。J.功能。分析。259 1043-1072之间·Zbl 1201.60051号 ·doi:10.1016/j.jfa.2010.04.017
[17] CVITANI ch,J.、POSSAMAÏ,D.和TOUZI,N.(2018年)。委托代理问题的动态规划方法。财务统计。22 1-37. ·Zbl 1391.91116号 ·doi:10.1007/s00780-017-0344-4
[18] CZICHOWSKY,C.(2013)。离散时间和连续时间的时间一致均值-方差投资组合选择。财务统计。17 227-271. ·Zbl 1263.91046号 ·doi:10.1007/s00780-012-0189-9
[19] Da Prato,G.和Zabczyk,J.(2014)。无穷维随机方程,第2版。数学百科全书及其应用152.剑桥大学出版社,剑桥·Zbl 1317.60077号 ·doi:10.1017/CBO9781107295513
[20] Dellacherie,C.和Meyer,P.-A.(1978年)。可能性和潜力.北韩数学研究29.荷兰北部,阿姆斯特丹·Zbl 0494.60001号
[21] DENIS,L.、HU,M.和PENG,S.(2011年)。与次线性期望相关的函数空间和容量:(G)-布朗运动路径的应用。潜在分析。34 139-161. ·Zbl 1225.60057号 ·doi:10.1007/s11118-010-9185-x
[22] DJETE,M.F.、POSSAMAÏ,D.和TAN,X.(2022)。McKean-Vlasov最优控制:动态规划原理。安·普罗巴伯。50 791-833. ·Zbl 1491.49018号 ·doi:10.1214/21-aop1548
[23] EKELAND,I.和LAZRAK,A.(2006年)。认真对待不承诺:连续时间内的子博弈完美均衡。ArXiv预打印ArXiv:0604264。
[24] EKELAND,I.和LAZRAK,A.(2010年)。当偏好时间不一致时的黄金法则。数学。财务。经济。4 29-55. ·Zbl 1255.91249号 ·doi:10.1007/s11579-010-0034-x
[25] EKELAND,I.和PIRVU,T.A.(2008年)。没有承诺的投资和消费。数学。财务。经济。2 57-86. ·Zbl 1177.91123号 ·doi:10.1007/s11579-008-0014-6
[26] EL KAROUI,N.和TAN,X.(2013年)。能力,可测量的选择和动态编程第一部分:抽象框架。ArXiv预打印ArXiv:1310.3363。
[27] EL KAROUI,N.和TAN,X.(2013年)。能力,可测选择和动态规划第二部分:在随机控制问题中的应用。arXiv预打印arXiv:1310.3364。
[28] FLEMING,W.H.和SONER,H.M.(2006)。受控马尔可夫过程与粘度解,第2版。随机建模与应用概率25.纽约州斯普林格。
[29] FREI,C.和DOS REIS,G.(2011年)。投资者相互作用的金融市场:是否存在均衡?数学。财务。经济。4 161-182. ·Zbl 1255.91447号 ·doi:10.1007/s11579-011-0039-0
[30] FUDENBERG,D.和LEVINE,D.K.(2006)。脉冲控制的双重自我模型。美国经济。版次。96 1449-1476.
[31] GOLDMAN,S.M.(1980)。一致的计划。经济收益率。螺柱。47 533-537. ·Zbl 0429.90019号
[32] GUL,F.和PESENDORFER,W.(2001)。诱惑和自制。计量经济学69 1403-1435. ·Zbl 1019.91017号 ·数字对象标识代码:10.1111/1468-0262.00252
[33] HAN,B.和WONG,H.Y.(2019年)。Volterra过程的时间一致反馈策略。ArXiv预印ArXiv:1907.11378。
[34] HARTER,J.和RICHOU,A.(2019年)。求解多维二次BSDE的稳定性方法。电子。J.概率。24第4号文件,51·兹比尔1416.60060 ·doi:10.1214/18-EJP260
[35] 何小东、胡小生、欧伯韬、J.和周小勇(2019)。赌场赌博的最佳退出时间:预先承诺和天真赌徒的策略。SIAM J.控制优化。57 1845-1868年·Zbl 1422.91482号 ·doi:10.137/18M1174738
[36] 何晓东、姜振林(2021)。连续时间内时间不一致问题的均衡策略。SIAM J.控制优化。59 3860-3886. ·Zbl 1471.91498号 ·数字对象标识代码:10.1137/20M1382106
[37] HE,X.D.,STRUB,M.S.和ZARIPHOPOULOU,T.(2021)。前向秩相关性能标准:概率失真下的时间一致性投资。数学。财务31 683-721. ·Zbl 1522.91224号 ·doi:10.1111/mafi.12298
[38] 何晓东、周晓云(2022)。我是谁:时间不一致、内心冲突与和解。随机分析、过滤和随机优化177-208. 查姆施普林格·Zbl 1504.91073号 ·doi:10.1007/978-3-030-98519-6_8
[39] HERNáNDEZ,C.(2021)。在二次多维I型BSVIE上,BSDE的无限族及其应用。ArXiv预打印ArXiv:2111.1131。
[40] HERNáNDEZ,C.和POSSAMAÏ,D.(2021)。I型倒向随机Volterra积分方程适定性的统一方法。电子。J.概率。26第89、35号论文·Zbl 1470.45021号 ·doi:10.1214/21-ejp653
[41] HERNANDEZ RAMIREZ,M.C.(2021)。我、我自己和我:时间不一致随机控制、契约理论和倒向随机Volterra积分方程ProQuest LLC,密歇根州安阿伯。论文(博士)-哥伦比亚大学。
[42] 胡毅、金宏和周小毅(2012)。时间不一致随机线性二次控制。SIAM J.控制优化。50 1548-1572·Zbl 1251.93141号 ·doi:10.1137/110853960
[43] 胡毅、金宏和周小毅(2017)。时间不一致随机线性二次控制:平衡的特征和唯一性。SIAM J.控制优化。55 1261-1279. ·兹比尔1414.91340 ·doi:10.1137/15M1019040
[44] HUANG,Y.-J.、NGUYEN-HUU,A.和ZHOU,X.Y.(2020年)。天真和非承诺复杂代理的一般停止行为,应用于概率失真。数学。财务30 310-340. ·Zbl 1508.91603号 ·doi:10.1111/mafi.12224
[45] HUANG,Y.-J.和ZHOU,Z.(2020)。连续时间内时间不一致停止问题的最优均衡。数学。财务30 1103-1134. ·Zbl 1508.91627号 ·doi:10.1111/mafi.12251
[46] HUANG,Y.-J.和ZHOU,Z.(2021)。连续时间内时间不一致随机控制的强平衡点和弱平衡点。数学。操作。物件。46 428-451. ·Zbl 1476.93160号 ·doi:10.1287/门2020.1066
[47] Jacod,J.和Shiryaev,A.N.(2003年)。随机过程的极限定理,第2版。德国数学研究所[数学科学基本原理] 288. 柏林施普林格·Zbl 1018.60002号 ·doi:10.1007/978-3-662-05265-5
[48] KARANDIKAR,R.L.(1995)。关于路径随机积分。随机过程。申请。57 11-18. ·Zbl 0816.60047号 ·doi:10.1016/0304-4149(95)00002-O
[49] Karatzas,I.和Shreve,S.E.(1991年)。布朗运动与随机微积分,第2版。数学研究生文本113.纽约斯普林格·Zbl 0734.60060号 ·doi:10.1007/978-1-4612-0949-2
[50] KARNAM,C.、MA,J.和ZHANG,J.(2017)。一些时间不一致优化问题的动态方法。附录申请。普罗巴伯。27 3435-3477. ·Zbl 1385.49019号 ·doi:10.1214/17-AAP1284
[51] 莱布森博士(1997年)。金蛋和双曲线折扣。Q.J.经济。112 443-477. ·Zbl 0882.90024号
[52] 兰德里亚特·D、李·B、李·D和杨·V·R(2018)。随机水平上均值-方差投资问题的均衡策略。SIAM J.金融数学。9 1046-1073. ·Zbl 1416.91354号 ·doi:10.1137/17M1153479
[53] LINDENSJÛ,K.(2019)。正则平衡解扩展的HJB系统。操作。Res.Lett公司。47 427-432. ·Zbl 1476.93161号 ·doi:10.1016/j.orl.2019.07.011
[54] MA,J.,WONG,T.-K.L.和ZHANG,J.(2021)。概率失真下的时间一致条件期望。数学。操作。物件。46 1149-1180. ·Zbl 1471.93282号 ·doi:10.1287/门2020.1101
[55] MCSHANE,E.J.(1983)。统一集成.纯数学和应用数学107.学术出版社[Harcourt Brace Jovanovich,出版商],纽约·Zbl 0551.28001号
[56] MEI,H.和ZHU,C.(2020年)。时间不一致McKean-Vlasov控制问题的闭环平衡。SIAM J.控制优化。58 3842-3867. ·Zbl 1461.93547号 ·数字对象标识代码:10.1137/20M1319796
[57] NUTZ,M.和VAN HANDEL,R.(2013)。在路径空间上构造次线性期望。随机过程。申请。123 3100-3121·Zbl 1285.93104号 ·doi:10.1016/j.spa.2013.03.022
[58] NUTZ,M.和ZHANG,Y.(2020年)。条件最优停止:时间不一致的优化。附录申请。普罗巴伯。30 1669-1692. ·兹比尔1464.60038 ·doi:10.1214/19-AAP1540
[59] O'DONOGHUE,T.和RABIN,M.(1999)。现在或以后再做。美国经济。版次。89 103-124.
[60] O'DONOGHUE,T.和RABIN,M.(1999)。对拖延者的激励。Q.J.经济。114 769-816. ·Zbl 0946.91044号
[61] 奥斯本·M·J和鲁宾斯坦·A(1994)。博弈论课程麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1194.91003号
[62] PAPAPANTOLEON,A.、POSSAMAÏ,D.和SAPLAOURAS,A.(2018)。带跳跃的BSDE的存在性和唯一性结果:整个九码。电子。J.概率。23第121、69号论文·Zbl 1406.60064号 ·doi:10.1214/18-EJP240
[63] PHELPS,E.S.和POLLAK,R.A.(1968年)。第二好的国家储蓄和游戏均衡增长。经济收益率。螺柱。35 185-199.
[64] POLLAK,R.A.(1968年)。一致的规划。经济收益率。螺柱。35 201-208年。
[65] Possamai,D.、Tan,X.和Zhou,C.(2018年)。一类非线性核的随机控制及其应用。安·普罗巴伯。46 551-603. ·兹比尔1393.60064 ·doi:10.1214/17-AOP1191
[66] 普洛特,体育(2005)。随机积分与微分方程,第2版。随机建模与应用概率21.柏林施普林格。2.1版,更正了第三次打印。 ·doi:10.1007/978-3-662-10061-5
[67] SAMUELSON,P.A.(1937年)。关于效用度量的注释。经济收益率。螺柱。4 155-161。
[68] SCH a L,M.(1974)。最优化问题的一个选择定理。拱门。数学. (巴塞尔) 25 219-224. ·Zbl 0351.90069号 ·doi:10.1007/BF01238668
[69] SONER,H.M.、TOUZI,N.和ZHANG,J.(2011)。关于\(G\)-期望的鞅表示定理。随机过程。申请。121 265-287. ·Zbl 1228.60070号 ·doi:10.1016/j.spa.2010.10.006
[70] Soner,H.M.、Touzi,N.和Zhang,J.(2012)。二阶倒向SDE的完备性。普罗巴伯。理论相关领域153 149-190. ·Zbl 1252.60056号 ·doi:10.1007/s00440-011-0342-y
[71] Stroock,D.W.和Varadhan,S.R.S.(1979年)。多维扩散过程.德国数学研究所[数学科学基本原理] 233. 柏林施普林格·Zbl 0426.60069号
[72] 斯特罗茨·R·H(1955)。动态效用最大化中的近视和不一致。经济收益率。螺柱。23 165-180.
[73] 谭国胜、魏伟和周晓云(2021)。时间不一致条件下平滑粘贴原理失效和平衡停止规则不存在。SIAM J.控制优化。59 4136-4154. ·Zbl 1476.91223号 ·doi:10.1137/19M1291339
[74] 范·内尔文,J.M.A.M.(2002)。用黎曼和逼近Bochner积分。印度。数学. (N.秒.) 13 197-208. ·Zbl 1019.28006号 ·doi:10.1016/S0019-3577(02)80005-2
[75] VIEILLE,N.和WEIBULL,J.W.(2009年)。准指数折扣下的多重解。经济学。理论39 513-526. ·Zbl 1206.90208号 ·doi:10.1007/s00199-008-0368-2
[76] WANG,H.和YONG,J.(2021)。时间不一致随机最优控制问题和倒向随机Volterra积分方程。ESAIM控制优化。计算变量。27第22、40号论文·兹比尔1467.93339 ·doi:10.1051/cocv/2021027
[77] WEI,Q.,YONG,J.和YU,Z.(2017)。时间不一致递归随机最优控制问题。SIAM J.控制优化。55 4156-4201. ·Zbl 1386.93314号 ·doi:10.1137/16M1079415
[78] XING,H.和ƀITKOVI-chi,G.(2018年)。一类全局可解的马尔可夫二次BSDE系统及其应用。安·普罗巴伯。46 491-550. ·Zbl 1390.60224号 ·doi:10.1214/17-AOP1190
[79] YONG,J.(2012)。时间不一致最优控制问题和平衡HJB方程。数学。控制关系。领域2 271-329. ·Zbl 1251.93144号 ·doi:10.3934/mcrf.2012.2.271
[80] 张杰(2017)。倒向随机微分方程:从线性理论到完全非线性理论.概率论与随机建模86.纽约施普林格·Zbl 1390.60004号 ·doi:10.1007/978-1-4939-7256-2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。