×

终端状态约束平均场前向随机控制系统的随机最大值原理。 (英语) Zbl 1338.93407号

摘要:本文考虑一个具有状态约束的最优控制问题,其中控制系统由平均场前向随机微分方程(简称MFFBSDE)描述,允许控制为平均场型。充分利用倒向随机微分方程理论,将原控制系统转化为等价的倒向形式,即控制系统中的方程都是倒向的。此外,Ekeland变分原理有助于我们处理状态约束,从而得到表征最优控制必要条件的随机最大值原理。我们还研究了一个具有状态约束的随机线性二次型控制问题。

MSC公司:

93年20日 最优随机控制
60 H10型 随机常微分方程(随机分析方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andersson D,Djehiche B.平均场类型SDE的最大值原理。应用数学优化,2010,63:341-356·Zbl 1215.49034号 ·doi:10.1007/s00245-010-9123-8
[2] Bensoussan,A.,随机控制讲座,1-39(1983),纽约
[3] Bielecki T,Jin H,Pliska S,等。破产禁止下的连续时间均值方差投资组合选择。数学金融,2005,15:213-244·Zbl 1153.91466号 ·doi:10.1111/j.0960-1627.2005.00218.x
[4] 铋J.最优随机控制中对偶性的介绍方法。SIAM J Control Optim,1978年,20:62-78·Zbl 0378.93049号
[5] Buckdahn R,Djehiche B,Li J.平均场型SDE的一般随机最大值原理。Appl Math Optim,2011,64:197-216·Zbl 1245.49036号 ·doi:10.1007/s00245-011-9136-y
[6] Buckdahn R,Djehiche B,Li J,等。平均场倒向随机微分方程,极限方法。Ann Probab,2009,37:1524-1565·Zbl 1176.60042号 ·doi:10.1214/08-AOP442
[7] Buckdahn R,Li J,Peng S G.Mean场倒向随机微分方程及相关偏微分方程。随机过程应用,2009,119:3133-3154·Zbl 1183.60022号 ·doi:10.1016/j.spa.2009.05.002
[8] Ekeland I.关于变分原理。数学分析应用杂志,1974,47:324-353·Zbl 0286.49015号 ·doi:10.1016/0022-247X(74)90025-0
[9] Haussmann U G.扩散最优控制的随机最大值原理。纽约:约翰·威利父子公司,1986年·Zbl 0616.93076号
[10] Hu Y.马尔可夫过程最优控制的最大值原理。数学学报,1990,33:43-56·Zbl 0723.93082号
[11] 季S,彭S。连续时间均值-方差投资组合选择的反向逼近终端摄动法。随机过程应用,2008,118:952-967·Zbl 1152.60051号 ·doi:10.1016/j.spa.2007.07.005
[12] 季思伟。终端状态约束下全耦合前向随机控制系统的最大值原理。数学分析应用杂志,2013,407:200-210·Zbl 1306.49041号 ·doi:10.1016/j.jmaa.2013.05.013
[13] 季S,周X。终端状态约束随机最优控制的最大值原理及其应用。公共信息系统,2006,6:321-338·Zbl 1132.93050号
[14] 季S,周X。g-概率的广义Neyman-Pearson引理。概率论相关领域,2010148:645-669·Zbl 1197.93163号 ·doi:10.1007/s00440-009-0244-4
[15] Karoui N E,Peng S,Queez M C.约束条件下递归效用优化的动态最大值原理。《Ann Appl Probab》,2001年,11:664-693·兹比尔1040.91038 ·doi:10.1214/aoap/1015345345
[16] Kushner H.连续参数随机优化问题的必要条件。SIAM J Control Optim,1972年,10:550-565·Zbl 0242.93063号 ·doi:10.1137/0310041
[17] Li J.平均场控制中的随机最大值原理。自动化,2012,48:366-373·Zbl 1260.93176号 ·doi:10.1016/j.自动2011.11.006
[18] Meyer-Brandis T,Øksenal B,Zhou X Y.通过Malliavin演算的平均场随机最大值原理。随机学,2012,84:5-6·Zbl 1252.49039号
[19] Pardoux E,Peng S.倒向随机微分方程的自适应解。系统控制快报,1990,14:55-61·Zbl 0692.93064号 ·doi:10.1016/0167-6911(90)90082-6
[20] 倒向随机微分方程及其在最优控制中的应用。应用数学优化,1993,27:125-144·兹比尔0769.60054 ·doi:10.1007/BF01195978
[21] Pliska S R.离散时间随机决策模型。收录:Fleming W H,Gorostiza L G,eds.滤波和最优随机控制进展。控制与信息科学课堂讲稿,42。纽约:Springer-Verlag,1982,290-304·Zbl 0501.90088号 ·doi:10.1007/BFb0004547
[22] Pliska S R.数学金融导论:离散时间模型。牛津:布莱克威尔,1997
[23] Yong J,Zhou X.随机控制:哈密顿系统和HJB方程。纽约:Springer-Verlag,1999·兹比尔0943.93002 ·doi:10.1007/978-1-4612-1466-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。