×

带反馈控制的条件过程的最优控制。 (英语。法语摘要) Zbl 1459.93188号

摘要:我们考虑了一类有限时间范围内的闭环随机最优控制问题,其中成本是一个期望条件,前提是过程没有退出给定的有界域。一个重要的困难是,制约策略的事件的概率随着时间的增长而衰减。最优性条件由一个偏微分方程组组成,包括一个Hamilton-Jacobi-Bellman方程(向后w.r.t.时间)和一个用于调节过程定律的Fokker-Planck方程(向前w.r.t时间)。这两个方程补充了Dirichlet条件。接下来,我们讨论了当时间范围趋于(+)时的渐近行为。这导致了一类新的最优控制问题,该问题由与边界上具有Dirichlet条件的连续性方程相关的特征值问题驱动。我们证明了后者的存在。我们还提出了数值方法,并用模拟补充了各种理论方面。

MSC公司:

93E20型 最优随机控制
93B52号 反馈控制
93B60型 特征值问题
49K20型 偏微分方程问题的最优性条件
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achdou,Y.,平均场博弈的有限差分方法,(Hamilton-Jacobi方程:近似数值分析和应用。Hamilton-Jacobi方程式:近似数值计算分析和应用,数学讲义,第2074卷(2013年),Springer:Springer-Heidelberg),1-47,MR 3135339·Zbl 1271.65120号
[2] Achdou,Y。;Capuzzo-Dolcetta,I.,《平均场游戏:数值方法》,SIAM J.Numer。分析。,48、3、1136-1162(2010年),MR 2679575(2011年j:91042)·Zbl 1217.91019号
[3] Achdou,Y。;Laurière,M.,具有拥塞的平均场型控制II:一种增广拉格朗日方法,Appl。数学。最佳。,74, 3, 579-618 (2016)
[4] Achdou,Y。;Porretta,A.,有限差分格式对平均场对策中产生的偏微分方程组弱解的收敛性,SIAM J.Numer。分析。,54、1、161-186(2016),MR 3452251·Zbl 1382.65273号
[5] 阿格蒙,S。;Douglis,A。;Nirenberg,L.,满足一般边界条件的椭圆偏微分方程解的边界附近估计。一、 Commun公司。纯应用程序。数学。,12623-727(1959),MR 0125307·Zbl 0093.10401号
[6] Bensoussan,A。;Frehse,J。;Yam,P.,《平均场游戏和平均场类型控制理论》,Springer Brief in Mathematics(2013),Springer:Springer New York·Zbl 1287.93002号
[7] Berestycki,H。;尼伦伯格,L。;Varadhan,S.R.S.,一般域中二阶椭圆算子的主特征值和最大值原理,Commun。纯应用程序。数学。,47、1、47-92(1994),MR 1258192·Zbl 0806.35129号
[8] Boccardo,L。;达尔·阿格里奥,A。;加洛特,t。;Orsina,L.,带测量数据的非线性抛物方程,J.Funct。分析。,147、1、237-258(1997),MR 1453181·Zbl 0887.35082号
[9] Boccardo,L。;Gallouöt,t.,涉及测量数据的非线性椭圆和抛物方程,J.Funct。分析。,87、1、149-169(1989),MR 1025884(92d:35286)·Zbl 0707.35060号
[10] Boccardo,L。;穆拉特,F。;Puel,J.-P.,《非bornées pour certaineséquations拟线性方程解的存在性》,港口数学。,41,1-4,507-534(1982),1984,MR 766873·Zbl 0524.35041号
[11] 博加乔夫,V.I。;Krylov,N.V。;Röckner,M。;Shaposhnikov,S.V.,Fokker-Planck-Kolmogorov方程,数学调查和专著,第207卷(2015),美国数学学会:美国数学学会普罗维登斯,RI,MR 3443169·兹比尔1342.35002
[12] 卡莫纳,R。;Delarue,F.,平均场正向随机微分方程,电子。Commun公司。概率。,18, 68, 15 (2013) ·Zbl 1297.93182号
[13] 卡莫纳,R。;Delarue,F.,平均场博弈的概率理论及其应用。一、 平均场FBSDE,控制与博弈,概率论与随机建模,第83卷(2018年),施普林格:施普林格-查姆,MR 3752669·Zbl 1422.91014号
[14] Davis,T.A.,算法832:UMFPACK V4.3——非对称模式多波前方法,ACM Trans。数学。软质。,30,2196-199(2004),MR 2075981·Zbl 1072.65037号
[15] 医学博士唐斯克。;Varadhan,S.R.S.,关于二阶椭圆微分算子的主特征值,Commun。纯应用程序。数学。,29,6595-621(1976),MR 0425380·Zbl 0356.35065号
[16] Du,Y.,非线性偏微分方程的阶结构和拓扑方法。第1卷,最大值原理与应用,偏微分方程与应用系列,第2卷(2006),世界科学出版公司:世界科学出版有限公司,新泽西州哈肯萨克,MR 2205529·Zbl 1202.35043号
[17] Evans,L.C.,偏微分方程,数学研究生课程,第19卷(2010),美国数学学会:美国数学学会普罗维登斯,RI,MR 2597943·Zbl 1194.35001号
[18] Gilbarg,D。;Trudinger,N.S.,二阶椭圆偏微分方程,数学经典(2001),Springer-Verlag:Springer-Verlag Berlin,1998年版再版,MR 1814364·Zbl 1042.35002号
[19] Krein,M.G。;Rutman,M.A.,《在Banach空间中留下不变锥的线性算子》,《美国数学》。社会事务。,1950、26、128(1950),MR 0038008
[20] 拉斯里,J-M。;狮子队、P-L.、Jeuxáchamp moyen。I.Le cas stationnaire,C.R.数学。阿卡德。科学。巴黎,343,9,619-625(2006),MR MR2269875(2007:91021)·Zbl 1153.91009号
[21] 拉斯里,J-M。;狮子队、P-L.、Jeuxáchamp moyen。二、。Horizon fini et control optimal,C.R.数学。阿卡德。科学。巴黎,343,10,679-684(2006),MR MR2271747(2007:91022)·Zbl 1153.91010号
[22] 拉斯里,J-M。;狮子队,P-L.,平均场比赛,Jpn。数学杂志。,2、1、229-260(2007),MR MR2295621·Zbl 1156.91321号
[23] Lehoucq,R.B。;索伦森特区。;Yang,C.,ARPACK用户指南,用隐式重新启动的Arnoldi方法解决大规模特征值问题,软件、环境和工具,第6卷(1998年),工业和应用数学学会(SIAM):工业与应用数学学会,宾夕法尼亚州费城,MR 1621681·Zbl 0901.65021号
[24] Lieberman,G.M.,《二阶抛物微分方程》(1996),世界科学出版社:世界科学出版社,新泽西州River Edge,MR 1465184·Zbl 0884.35001号
[25] 《狮子》,P-L.(2016),法国大学出版社
[26] 努斯鲍姆(Nussbaum,R.D.)。;Pinchover,Y.,关于二阶椭圆算子广义主特征值的变分原理及其应用,J.Anal。数学。,59、161-177(1992),在Shmuel Agmon 70岁生日之际举行的Festschrift。MR 1226957号·Zbl 0816.35095号
[27] Porretta,A.,福克-普朗克方程和平均场博弈的弱解,Arch。定额。机械。分析。,216、1、1-62(2015),MR 3305653·Zbl 1312.35168号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。