×

平均场前向随机微分方程部分可观测风险敏感最优控制问题的随机最大值原理。 (英语) Zbl 1531.93437号

摘要:本文研究由平均场前向随机微分方程描述的部分可观测风险敏感最优控制问题,其代价函数是平均场指数的积分型。利用Girsanov定理和经典凸变分技术,我们得到了两个风险敏感的极大值原理,并用变分不等式进行了表征。此外,在一定的凹性假设下,我们给出了最优性的充分条件。通过结果的应用,我们分别考虑了部分观测信息和完全观测信息下的线性二次风险敏感最优控制问题。
{©2021 John Wiley&Sons有限公司}

理学硕士:

93E20型 最优随机控制
49纳米10 线性二次型最优控制问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] KacM动力学理论基础。第三届伯克利数理统计与概率研讨会论文集;第3卷,1956:171‐197·Zbl 0072.42802号
[2] 麦肯·惠普。与非线性抛物方程相关的一类马尔可夫过程。美国国家科学院院刊;第56卷,1966:1907‐1911·Zbl 0149.13501号
[3] HuangM、CainesPE、MalhameRP。无线通信系统中的上行链路功率调整:随机控制分析。IEEE Trans Automat控制。2004;49:1693‐1708. ·Zbl 1365.93545号
[4] McNamaraJM、HoustonAK、CollinsEJ。行为生物学中的最优模型。SIAM 2001版;43:413‐466. ·Zbl 0973.92027号
[5] 戴·普拉普(Dai PraP),登·奥朗德·F。随机介质中相互作用随机过程的McKean‐Vlasov极限。统计物理学杂志。1996;84(3-4):735‐772. ·Zbl 1081.60554号
[6] BuckdahnR、DjehicheB、LiJ、PengSG。平均场倒向随机微分方程:极限方法。Ann Probab。2009;37(4):1524‐1565. ·Zbl 1176.60042号
[7] BuckdahnR、LiJ、PengSG。平均场倒向随机微分方程和相关偏微分方程。斯托克处理他们的申请。2007;119(10):3133‐3154. ·Zbl 1183.60022号
[8] 吴振鹏。完全耦合的前向-后向随机微分方程及其在最优控制中的应用。SIAM J控制优化。1999;37(3):825‐843. ·Zbl 0931.60048号
[9] BahlaliK、GherbalB、MezerdiB。FBSDE驱动的系统存在最优控制。系统控制通讯。2011;60(5):344‐349. ·Zbl 1214.49010号
[10] 黄建华、LiX、WangG。线性向前向后随机系统的近最优控制问题。自动化。2010;46(2):397‐404. ·Zbl 1205.93165号
[11] JiS和WeiQ。具有终端状态约束的完全耦合正倒向随机控制系统的最大值原理。数学分析应用杂志。2013;407(2):200‐210. ·Zbl 1306.49041号
[12] SulemA,OksendalB。模型不确定性下的正向随机微分对策与随机控制。最优化理论应用杂志。2014;161:22‐55. ·Zbl 1290.49076号
[13] 王GC,肖赫,邢国杰。带噪声观测的平均场正倒向随机微分方程的最优控制问题。自动化。2017;86:104‐109. ·Zbl 1375.93143号
[14] LiRJ、LiuB。平均场型完全耦合随机控制系统的最大值原理。数学分析应用杂志。2014;415(2):902‐930. ·Zbl 1326.49040号
[15] MaHP、LiuB。部分观测的平均场型正倒向随机微分方程的线性二次型最优控制问题。亚洲J控制。2016;18:2146‐2157. ·Zbl 1354.93174号
[16] 德拉鲁埃夫·卡莫纳。平均场正向随机微分方程。电子通信概率。2013;18(68):1-15·Zbl 1297.93182号
[17] BuckdahnR、DjehicheB、LiJ。平均场型SDE的一般随机最大值原理。应用数学优化。2011;64(2):197‐216. ·兹比尔1245.49036
[18] 肖特克·申伊。跳跃扩散平均场模型的最大值原理及其在均值-方差问题中的应用。非线性分析理论方法应用。2013;86:58‐73. ·Zbl 1279.49015号
[19] 巴萨。风险敏感非线性随机微分对策的纳什均衡。最优化理论应用杂志。1999;100(3):479‐498. ·Zbl 0949.91005号
[20] 雅各布森DH。具有指数准则的最优随机线性系统及其与确定性微分对策的关系。IEEE Trans Automat控制。1973;18(2):124‐131. ·Zbl 0274.93067号
[21] 巴萨特MoonJ。马尔可夫跳跃线性系统的风险敏感控制:注意事项和困难。国际J控制自动化系统。2017;15(1):462‐467.
[22] BensoussanA,Van SchuppenJH。具有指数积分性能指标的部分可观测随机系统的最优控制。SIAM J控制优化。1985;23(4):599‐613. ·Zbl 0574.93067号
[23] 弗莱明WH。风险敏感随机控制与微分对策。公共信息系统。2006;6(3):161‐177. ·Zbl 1132.93049号
[24] 黄建华、利克斯、王GC。一类部分信息风险敏感最优控制的最大原则。IEEE Trans-Automat控制。2010;55(6):1438‐1443. ·Zbl 1368.93139号
[25] 惠特尔。风险敏感最大原则。系统控制许可。1990年;15(3):183‐192. ·Zbl 0724.93084号
[26] LimAEB,ZhouXY。新的风险敏感最大值原则。IEEE Trans Automat控制。2005;50(7):958‐966. ·Zbl 1365.49025号
[27] 查拉。倒向随机微分方程的Pontryagins风险敏感随机最大值原理及其应用。公牛巴西数学Soc新Ser。2017;48(3):1678‐7714.
[28] 查拉。倒向随机微分方程风险敏感控制问题的充分最优性条件及其应用。数字数学杂志。2017;9(1):48‐60. ·Zbl 1387.93185号
[29] ChalaA、Hafayed D、KhalloutR。使用Girsanov定理描述风险敏感问题并应用于最优控制。In:DeangeloTD(ed.),ed.随机微分方程基础与应用。Nova Science Publishers公司;2018:111‐142.
[30] KhalloutR,ChalaA。全耦合正倒向随机微分方程的风险敏感随机最大值原理及其应用。亚洲J控制。2019;22(3):1360‐1371。
[31] 史杰、吴忠。跳跃扩散最优控制的风险敏感随机最大值原理及其应用。数学科学学报。2011;31(2):419‐433. ·Zbl 1240.93365号
[32] 史杰、吴忠。风险敏感随机最优控制问题的极大值原理及其在金融中的应用。斯托克分析应用。2012;30(6):997‐1018. ·Zbl 1252.49040号
[33] 太阳。Z、 Kemajou‐Brown,I.和Menoukeu‐Pamen,O.(2018年)。马尔可夫状态切换跳跃扩散系统的风险敏感最大值原理及其应用。ESAIM控制优化计算变量,24(3),985-1013·Zbl 1405.93234号
[34] FlemingWH,SonerHM。受控马尔可夫过程和粘度解。施普林格科技与商业媒体;2006年·Zbl 1105.60005号
[35] PliskaSR BieleckiTR。风险敏感的动态资产管理。应用数学优化。1999;39(3):337‐360. ·Zbl 0984.91047号
[36] 利奥斯·戴维斯。跳跃扩散风险敏感资产管理I:扩散因子模型。SIAM J金融数学。2011;2(1):22‐54. ·Zbl 1217.91168号
[37] 利奥斯·戴维斯。跳跃扩散风险敏感资产管理II:跳跃扩散因子模型。SIAM J控制优化。2013;51(2):1441‐1480. ·Zbl 1291.35409号
[38] LimAEB,ZhouXY。HARA实用程序的风险敏感控制。IEEE Trans Automat控制。2001;46(4):563‐578. ·兹比尔1030.93055
[39] 惠特尔。风险敏感线性二次高斯控制。高级应用概率。1981;13:764‐777. ·Zbl 0489.93067号
[40] MoonJ、DuncanTE、BasarT。风险敏感的零和差分博弈。IEEE Trans Automat控制。2019;64(4):1530‐1518. ·Zbl 1482.91032号
[41] 穆罕默德·伊斯。具有无界系数的风险敏感非零和随机微分对策。Dyn游戏应用程序。2020;1‐25.
[42] DjehicheB,TembineH。风险敏感平均场类型控制的随机最大值原理。IEEE Trans Automat控制。2015;60(10):2640‐2649. ·Zbl 1360.93772号
[43] TembineH、ZhuQY、BasarT。风险敏感的平均场游戏。IEEE Trans Automat控制。2013;59(4):835‐850. ·Zbl 1360.49032号
[44] TembineH、ZhuQY、BasarT。风险敏感平均场随机微分对策。IFAC Proc Vol.2011年;44(1):3222‐3227.
[45] 月亮J。受控正向随机微分方程的风险敏感最大值原理。自动化。2020;120:109069. ·Zbl 1448.93349号
[46] 查拉。关于奇异风险敏感随机最大值原理。国际J控制。2020;94:2846‐2856. ·Zbl 1478.93730号
[47] 哈法耶德·查拉阿。关于平均场型完全耦合正向-反向随机控制的风险敏感性的随机最大值原理及其应用。进化Equ控制理论。2020年;9(3):817‐843. ·Zbl 1455.91216号
[48] 月亮J。广义风险敏感最优控制和hamilton‐jacobi‐bellman方程。IEEE Trans Automat控制。2021;2319年-2325年·Zbl 07352156号
[49] LiRJ、FuFY。平均场FBSDE部分观测最优控制问题的最大值原理。国际J控制。2019;92(10):2463‐2472. ·Zbl 1423.93418号
[50] 史杰、吴忠。完全耦合正向随机系统部分可观测最优控制的最大值原理。最优化理论应用杂志。2010;145(3):543‐578. ·Zbl 1209.49034号
[51] WuZ公司。前向-后向随机控制系统部分可观测最优控制的最大值原理。科学中国信息科学。2010;53:2205‐2214. ·Zbl 1227.93116号
[52] 小H。具有随机跳跃的前向-后向随机系统的部分可观测最优控制的最大值原理。系统科学综合杂志。2011;24(6):1083‐1099. ·Zbl 1338.93408号
[53] YangBX、GuoTX、WuJB。部分可观测的时滞非零和随机微分对策及其在金融中的应用。亚洲J控制。2019;21(2):1‐12.
[54] ZhuQ、RenY、WuWX。部分信息下具有跳跃的平均场正倒向随机系统的最优平均场控制问题。系统科学综合杂志。2017;30(4):828‐856. ·Zbl 1381.93106号
[55] 德拉鲁埃夫·卡莫纳。平均场博弈的概率分析。SIAM J控制优化。2013;51(4):2705‐2734. ·Zbl 1275.93065号
[56] MaJ、YongJMS。正倒向随机微分方程及其应用。施普林格科技与商业媒体;1999年·Zbl 0927.60004号
[57] 王GC,WuZ。部分观察到的风险敏感最优控制问题的一般最大值原理及其在金融中的应用。最优化理论应用杂志。2009;141(3):677‐700. ·Zbl 1178.49049号
[58] 马赫、刘波。平均场型部分可观测风险敏感最优控制问题的最大值原理。Eur J控制。2016;32:16‐23. ·Zbl 1355.93213号
[59] 马赫、刘波。部分信息风险敏感平均场随机时滞微分方程的最优控制问题。亚洲J控制。2017;19(6):2097‐2115. ·Zbl 1386.93311号
[60] SunZ,Menoukeu‐PamenO。马尔可夫状态切换跳扩散系统部分可观测风险敏感最优控制的最大值原理。斯托克分析应用。2018;36(5):782‐811. ·Zbl 1407.93434号
[61] SaldiN、BasarT、RaginskyM。部分观察到的离散时间风险敏感平均场博弈。IEEE第58届决策与控制会议(CDC)会议记录;2019:317‐322; IEEE标准。
[62] 月亮J。平均场型马尔可夫状态切换跳扩散系统随机最优控制的风险敏感最大值原理。国际J鲁棒非线性控制。2021;31:2141‐2167. ·Zbl 1526.93280号
[63] BensoussanA、YamSCP、ZhangZF。平均场型前向-后向随机微分方程的适定性。堆垛工艺应用。2015;125(9):3327‐3354. ·Zbl 1327.60114号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。