\`x^2+y_1+z_12^34\`
高级搜索
文章内容
文章内容

依赖不确定性下的数据驱动非参数鲁棒控制

  • *通讯作者:埃尔汉·贝拉克塔尔

    *通讯作者:埃尔汉·贝拉克塔尔

E.Bayraktar得到了[国家科学基金会资助DMS-2106556和Susan M.Smith主席]的支持

摘要 全文(HTML) (1)/表(1) 相关论文 引用人
  • 我们考虑一个多周期随机控制问题,其中系统的多元驱动随机因子具有已知的边际分布,但依赖结构不确定。为了解决这个问题,我们提出了一种非参数自适应鲁棒控制框架。我们的目标是在连续观测数据产生的一系列收缩不确定性集中,找到针对最坏情况连接函数的最优控制。然后,我们使用随机梯度下降-上升算法来数值处理相应的高维动态inf-sup优化问题。我们在效用最大化的背景下给出了数值结果,并表明控制器受益于了解有关不确定模型的更多信息。

    数学学科分类:初级:49L20、49J55、93E20、93E35、60G15、65K05、90C39、90C40、91G10、91G60、62G05。

    引用:

    \开始{方程式}\\结束{方程式{
  • 加载中
  • 图1。 财富沿着样本外的路径演变。左上角:$\varphi^{*,\varepsilon}$;产生的财富的方框图;右上角:$\varphi^e$;产生的财富的方框图;左下角:$\varphi^{\text{tr}}$产生的财富方框图;右下:平均财富比较

    表1。 样本外终端财富的预期效用、方差、30%分位数、90%分位数、最大值和最小值。AR:自适应鲁棒性;TR:无不确定性

    应收账 AR(无边距) TR公司
    V美元$ 19.8726 19.8659 19.8857
    $\text{var}(X_T)$ 441.7334 628.7182 118.3159
    $q_{0.30}(X_T)$ 92.4007 90.4748 96.3813
    $q_{0.90}(X_T)$ 136.7146 144.7677 121.2001
    $\text{max}(X_T)$ 190.4936 220.5724 144.6299
    $\text{min}(X_T)$ 51.2641 48.7990 77.4599
    |显示表格
    下载:CSV公司
  • [1] E.Bayraktar和T.Chen,模型不确定性下的非参数自适应鲁棒控制,预印本,2022年。arXiv公司:2202.10391.
    [2] D.P.Bertsekas和S.E.Shreve,随机最优控制:离散时间情形学术出版社,1978年。
    [3] T.布迪萨克桑Á. 卡特亚,跳跃扩散过程的在线漂移估计,伯努利-伯努利学会杂志,27(2021), 2494-2518. 数字对象标识:10.3150/20-BEJ1319。
    [4] T.比勒基T·陈I.Cialenco公司,置信区的递归构造,电子。J.统计。,11(2017), 4674-4700. 数字对象标识:10.1214/17-EJS1362。
    [5] T.R.Bielecki,T.Chen和I.Cialenco,模型不确定性下的时间不一致马尔可夫控制问题及其在均值投资组合选择中的应用,国际理论与应用金融杂志,24(2021年),第2150003号论文,28页。数字对象标识:10.1142/S0219024921500035。
    [6] H.F.Chen和L.Guo,辨识与随机自适应控制,系统与控制:基础与应用。Birkhäuser Boston,Inc.,1991年。数字对象标识:10.1007/978-1-4612-0429-9.
    [7] T·陈卢德科夫斯基,自适应鲁棒效用最大化和套期保值的机器学习方法,SIAM金融数学杂志,12(2021), 1226-1256. 数字对象标识:10.1137/20M1336023。
    [8] T.Chen和J.Myung,模型不确定性下的非参数自适应贝叶斯随机控制,预印本,2020年。arXiv:2011.04804年.
    [9] E.德尔巴里奥E.杜松子酒C.马特兰,经验分布和真实分布之间wasserstein距离的中心极限定理,概率年鉴,27(1999), 1009-1071. 数字对象标识:10.1214/aop/1022677394。
    [10] N.福尼尔A.吉林,关于经验测度的Wasserstein距离的收敛速度,概率论及其相关领域,162(2015), 707-738. 数字对象标识:10.1007/s00440-014-0583-7。
    [11] R.Gao和A.Kleywegt,具有已知边际分布的数据驱动稳健优化,In技术报告,佐治亚理工学院,2017年。
    [12] I.吉尔博亚D.施梅德勒。,Maxmin预期效用与非均匀先验,数学杂志。经济。,18(1989), 141-153. 数字对象标识:10.1016/0304-4068(89)90018-9.
    [13] P.R.Kumar和P.Varaiya,随机系统:估计、识别和自适应控制,《应用数学经典》,75。工业和应用数学学会(SIAM),宾夕法尼亚州费城,2016年。数字对象标识:10.1137/1.9781611974263.
    [14] P.Mohajerin Esfahani先生D.库恩,使用Wasserstein度量的数据驱动分布式稳健优化:性能保证和易处理的重新设计,数学规划,171(2018), 115-166. 数字对象标识:2007年10月10日/10107-017-1172-1。
    [15] C.E.Rasmussen和C.K.I.Williams,机器学习的高斯过程、麻省理工学院出版社,2006年。
    [16] 里德大学贝叶斯动态规划,高级申请。探针。,7(1975), 330-348. 数字对象标识:10.2307/1426080.
  • 加载中
开放式访问在知识共享下许可证

数字(1)

桌子(1)

分享

文章指标

HTML视图(1117) PDF下载(113) 引用人(0)

访问历史记录

作者撰写的其他文章

目录

    /

    返回
    返回