魏庆萌 终端状态约束平均场前向随机控制系统的随机最大值原理。 (英语) Zbl 1338.93407号 科学。中国,数学。 59,第4期,809-822(2016). 摘要:本文考虑一个具有状态约束的最优控制问题,其中控制系统由平均场前向随机微分方程(简称MFFBSDE)描述,允许控制为平均场型。充分利用倒向随机微分方程理论,将原控制系统转化为等价的倒向形式,即控制系统中的方程都是倒向的。此外,Ekeland变分原理有助于我们处理状态约束,从而得到表征最优控制必要条件的随机最大值原理。我们还研究了一个具有状态约束的随机线性二次型控制问题。 引用于三文件 MSC公司: 93年20日 最优随机控制 60 H10型 随机常微分方程(随机分析方面) 关键词:平均场正反随机微分方程;最大值原理;状态约束 PDF格式BibTeX公司 XML格式引用 \textit{Q.Wei},科学。中国,数学。59,第4号,809--822(2016;Zbl 1338.93407) 全文: 内政部 参考文献: [1] Andersson D,Djehiche B.平均场类型SDE的最大值原理。应用数学优化,2010,63:341-356·Zbl 1215.49034号 ·doi:10.1007/s00245-010-9123-8 [2] Bensoussan,A.,随机控制讲座,1-39(1983),纽约 [3] Bielecki T,Jin H,Pliska S,等。破产禁止下的连续时间均值方差投资组合选择。数学金融,2005,15:213-244·Zbl 1153.91466号 ·doi:10.1111/j.0960-1627.2005.00218.x [4] 铋J.最优随机控制中对偶性的介绍方法。SIAM J Control Optim,1978年,20:62-78·Zbl 0378.93049号 [5] Buckdahn R,Djehiche B,Li J.平均场型SDE的一般随机最大值原理。Appl Math Optim,2011,64:197-216·Zbl 1245.49036号 ·doi:10.1007/s00245-011-9136-y [6] Buckdahn R,Djehiche B,Li J,等。平均场倒向随机微分方程,极限方法。Ann Probab,2009,37:1524-1565·Zbl 1176.60042号 ·doi:10.1214/08-AOP442 [7] Buckdahn R,Li J,Peng S G.Mean场倒向随机微分方程及相关偏微分方程。随机过程应用,2009,119:3133-3154·Zbl 1183.60022号 ·doi:10.1016/j.spa.2009.05.002 [8] Ekeland I.关于变分原理。数学分析应用杂志,1974,47:324-353·Zbl 0286.49015号 ·doi:10.1016/0022-247X(74)90025-0 [9] Haussmann U G.扩散最优控制的随机最大值原理。纽约:约翰·威利父子公司,1986年·Zbl 0616.93076号 [10] Hu Y.马尔可夫过程最优控制的最大值原理。数学学报,1990,33:43-56·Zbl 0723.93082号 [11] 季S,彭S。连续时间均值-方差投资组合选择的反向逼近终端摄动法。随机过程应用,2008,118:952-967·Zbl 1152.60051号 ·doi:10.1016/j.spa.2007.07.005 [12] 季思伟。终端状态约束下全耦合前向随机控制系统的最大值原理。数学分析应用杂志,2013,407:200-210·Zbl 1306.49041号 ·doi:10.1016/j.jmaa.2013.05.013 [13] 季S,周X。终端状态约束随机最优控制的最大值原理及其应用。公共信息系统,2006,6:321-338·Zbl 1132.93050号 [14] 季S,周X。g-概率的广义Neyman-Pearson引理。概率论相关领域,2010148:645-669·Zbl 1197.93163号 ·doi:10.1007/s00440-009-0244-4 [15] Karoui N E,Peng S,Queez M C.约束条件下递归效用优化的动态最大值原理。《Ann Appl Probab》,2001年,11:664-693·兹比尔1040.91038 ·doi:10.1214/aoap/1015345345 [16] Kushner H.连续参数随机优化问题的必要条件。SIAM J Control Optim,1972年,10:550-565·Zbl 0242.93063号 ·doi:10.1137/0310041 [17] Li J.平均场控制中的随机最大值原理。自动化,2012,48:366-373·Zbl 1260.93176号 ·doi:10.1016/j.自动2011.11.006 [18] Meyer-Brandis T,Øksenal B,Zhou X Y.通过Malliavin演算的平均场随机最大值原理。随机学,2012,84:5-6·Zbl 1252.49039号 [19] Pardoux E,Peng S.倒向随机微分方程的自适应解。系统控制快报,1990,14:55-61·Zbl 0692.93064号 ·doi:10.1016/0167-6911(90)90082-6 [20] 倒向随机微分方程及其在最优控制中的应用。应用数学优化,1993,27:125-144·兹比尔0769.60054 ·doi:10.1007/BF01195978 [21] Pliska S R.离散时间随机决策模型。收录:Fleming W H,Gorostiza L G,eds.滤波和最优随机控制进展。控制与信息科学课堂讲稿,42。纽约:Springer-Verlag,1982,290-304·Zbl 0501.90088号 ·doi:10.1007/BFb0004547 [22] Pliska S R.数学金融导论:离散时间模型。牛津:布莱克威尔,1997 [23] Yong J,Zhou X.随机控制:哈密顿系统和HJB方程。纽约:Springer-Verlag,1999·兹比尔0943.93002 ·doi:10.1007/978-1-4612-1466-3 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。