-
摘要
我们考虑一个多周期随机控制问题,其中系统的多元驱动随机因子具有已知的边际分布,但依赖结构不确定。为了解决这个问题,我们提出了一种非参数自适应鲁棒控制框架。我们的目标是在连续观测数据产生的一系列收缩不确定性集中,找到针对最坏情况连接函数的最优控制。然后,我们使用随机梯度下降-上升算法来数值处理相应的高维动态inf-sup优化问题。我们在效用最大化的背景下给出了数值结果,并表明控制器受益于了解有关不确定模型的更多信息。
数学学科分类:初级:49L20、49J55、93E20、93E35、60G15、65K05、90C39、90C40、91G10、91G60、62G05。
\开始{方程式}\\结束{方程式{
-
-
-
工具书类
[1] |
E.Bayraktar和T.Chen,模型不确定性下的非参数自适应鲁棒控制,预印本,2022年。arXiv公司:2202.10391.
|
[2] |
D.P.Bertsekas和S.E.Shreve,随机最优控制:离散时间情形,学术出版社,1978年。
|
[3] |
T.布迪萨克桑和Á. 卡特亚,跳跃扩散过程的在线漂移估计,伯努利-伯努利学会杂志,27(2021), 2494-2518. 数字对象标识:10.3150/20-BEJ1319。
|
[4] |
T.比勒基, T·陈和I.Cialenco公司,置信区的递归构造,电子。J.统计。,11(2017), 4674-4700. 数字对象标识:10.1214/17-EJS1362。
|
[5] |
T.R.Bielecki,T.Chen和I.Cialenco,模型不确定性下的时间不一致马尔可夫控制问题及其在均值投资组合选择中的应用,国际理论与应用金融杂志,24(2021年),第2150003号论文,28页。数字对象标识:10.1142/S0219024921500035。
|
[6] |
H.F.Chen和L.Guo,辨识与随机自适应控制,系统与控制:基础与应用。Birkhäuser Boston,Inc.,1991年。数字对象标识:10.1007/978-1-4612-0429-9.
|
[7] |
T·陈和卢德科夫斯基,自适应鲁棒效用最大化和套期保值的机器学习方法,SIAM金融数学杂志,12(2021), 1226-1256. 数字对象标识:10.1137/20M1336023。
|
[8] |
T.Chen和J.Myung,模型不确定性下的非参数自适应贝叶斯随机控制,预印本,2020年。arXiv:2011.04804年.
|
[9] |
E.德尔巴里奥, E.杜松子酒和C.马特兰,经验分布和真实分布之间wasserstein距离的中心极限定理,概率年鉴,27(1999), 1009-1071. 数字对象标识:10.1214/aop/1022677394。
|
[10] |
N.福尼尔和A.吉林,关于经验测度的Wasserstein距离的收敛速度,概率论及其相关领域,162(2015), 707-738. 数字对象标识:10.1007/s00440-014-0583-7。
|
[11] |
R.Gao和A.Kleywegt,具有已知边际分布的数据驱动稳健优化,In技术报告,佐治亚理工学院,2017年。
|
[12] |
I.吉尔博亚和D.施梅德勒。,Maxmin预期效用与非均匀先验,数学杂志。经济。,18(1989), 141-153. 数字对象标识:10.1016/0304-4068(89)90018-9.
|
[13] |
P.R.Kumar和P.Varaiya,随机系统:估计、识别和自适应控制,《应用数学经典》,75。工业和应用数学学会(SIAM),宾夕法尼亚州费城,2016年。数字对象标识:10.1137/1.9781611974263.
|
[14] |
P.Mohajerin Esfahani先生和D.库恩,使用Wasserstein度量的数据驱动分布式稳健优化:性能保证和易处理的重新设计,数学规划,171(2018), 115-166. 数字对象标识:2007年10月10日/10107-017-1172-1。
|
[15] |
C.E.Rasmussen和C.K.I.Williams,机器学习的高斯过程、麻省理工学院出版社,2006年。
|
[16] |
里德大学贝叶斯动态规划,高级申请。探针。,7(1975), 330-348. 数字对象标识:10.2307/1426080.
|
-
访问历史记录
-