Data-driven nonparametric robust control under dependence uncertainty

Erhan Bayraktar; Tao Chen

doi:10.3934/fmf.2023004

文章内容

2023年第2卷, 第1版: 99-123. Doi公司：10.3934/fmf.2023004年

这个问题上一篇文章市场微观结构中的幂律下一篇文章 EMA型交易策略在部分信息下实现效用最大化

依赖不确定性下的数据驱动非参数鲁棒控制

埃尔汉·贝拉克塔尔^1, , 和
陈涛（Tao Chen）^1,

1
美国密歇根大学数学系

^*通讯作者：埃尔汉·贝拉克塔尔
^*通讯作者：埃尔汉·贝拉克塔尔

收到日期： 2022年9月

修订日期： 2022年11月

提前访问： 2023年3月

发布时间： 2023年3月

E.Bayraktar得到了[国家科学基金会资助DMS-2106556和Susan M.Smith主席]的支持

摘要全文（HTML）图(1)/表(1) 相关论文引用人

摘要

我们考虑一个多周期随机控制问题，其中系统的多元驱动随机因子具有已知的边际分布，但依赖结构不确定。为了解决这个问题，我们提出了一种非参数自适应鲁棒控制框架。我们的目标是在连续观测数据产生的一系列收缩不确定性集中，找到针对最坏情况连接函数的最优控制。然后，我们使用随机梯度下降-上升算法来数值处理相应的高维动态inf-sup优化问题。我们在效用最大化的背景下给出了数值结果，并表明控制器受益于了解有关不确定模型的更多信息。

关键词：

数学学科分类：初级：49L20、49J55、93E20、93E35、60G15、65K05、90C39、90C40、91G10、91G60、62G05。

引用：

全文（HTML）

图1。 财富沿着样本外的路径演变。左上角：$\varphi^{*，\varepsilon}$；产生的财富的方框图；右上角：$\varphi^e$；产生的财富的方框图；左下角：$\varphi^{\text｛tr｝}$产生的财富方框图；右下：平均财富比较

下载：全尺寸图像 PowerPoint幻灯片

表1。 样本外终端财富的预期效用、方差、30%分位数、90%分位数、最大值和最小值。AR：自适应鲁棒性；TR：无不确定性

	应收账	AR（无边距）	TR公司
V美元$	19.8726	19.8659	19.8857
$\text{var}（X_T）$	441.7334	628.7182	118.3159
$q_{0.30}（X_T）$	92.4007	90.4748	96.3813
$q_{0.90}（X_T）$	136.7146	144.7677	121.2001
$\text{max}（X_T）$	190.4936	220.5724	144.6299
$\text{min}（X_T）$	51.2641	48.7990	77.4599

|显示表格

下载：CSV公司

相关论文

引用人

工具书类

[1]	E.Bayraktar和T.Chen，模型不确定性下的非参数自适应鲁棒控制，预印本，2022年。arXiv公司：2202.10391.
[2]	D.P.Bertsekas和S.E.Shreve，随机最优控制：离散时间情形，学术出版社，1978年。
[3]	T.布迪萨克桑和Á. 卡特亚，跳跃扩散过程的在线漂移估计，伯努利-伯努利学会杂志,27(2021), 2494-2518. 数字对象标识：10.3150/20-BEJ1319。
[4]	T.比勒基, T·陈和I.Cialenco公司，置信区的递归构造，电子。J.统计。,11(2017), 4674-4700. 数字对象标识：10.1214/17-EJS1362。
[5]	T.R.Bielecki，T.Chen和I.Cialenco，模型不确定性下的时间不一致马尔可夫控制问题及其在均值投资组合选择中的应用，国际理论与应用金融杂志,24（2021年），第2150003号论文，28页。数字对象标识：10.1142/S0219024921500035。
[6]	H.F.Chen和L.Guo，辨识与随机自适应控制，系统与控制：基础与应用。Birkhäuser Boston，Inc.，1991年。数字对象标识：10.1007/978-1-4612-0429-9.
[7]	T·陈和卢德科夫斯基，自适应鲁棒效用最大化和套期保值的机器学习方法，SIAM金融数学杂志,12(2021), 1226-1256. 数字对象标识：10.1137/20M1336023。
[8]	T.Chen和J.Myung，模型不确定性下的非参数自适应贝叶斯随机控制，预印本，2020年。arXiv:2011.04804年.
[9]	E.德尔巴里奥, E.杜松子酒和C.马特兰，经验分布和真实分布之间wasserstein距离的中心极限定理，概率年鉴,27(1999), 1009-1071. 数字对象标识：10.1214/aop/1022677394。
[10]	N.福尼尔和A.吉林，关于经验测度的Wasserstein距离的收敛速度，概率论及其相关领域,162(2015), 707-738. 数字对象标识：10.1007/s00440-014-0583-7。
[11]	R.Gao和A.Kleywegt，具有已知边际分布的数据驱动稳健优化，In技术报告，佐治亚理工学院，2017年。
[12]	I.吉尔博亚和D.施梅德勒。，Maxmin预期效用与非均匀先验，数学杂志。经济。,18(1989), 141-153. 数字对象标识：10.1016/0304-4068(89)90018-9.
[13]	P.R.Kumar和P.Varaiya，随机系统：估计、识别和自适应控制，《应用数学经典》，75。工业和应用数学学会（SIAM），宾夕法尼亚州费城，2016年。数字对象标识：10.1137/1.9781611974263.
[14]	P.Mohajerin Esfahani先生和D.库恩，使用Wasserstein度量的数据驱动分布式稳健优化：性能保证和易处理的重新设计，数学规划,171(2018), 115-166. 数字对象标识：2007年10月10日/10107-017-1172-1。
[15]	C.E.Rasmussen和C.K.I.Williams，机器学习的高斯过程、麻省理工学院出版社，2006年。
[16]	里德大学贝叶斯动态规划，高级申请。探针。,7(1975), 330-348. 数字对象标识：10.2307/1426080.