×

具有非加性迭代相关马尔可夫噪声的随机递归包含。 (英语) Zbl 1493.62495号

摘要:本文研究了具有集值漂移函数和非加性迭代相关马尔可夫噪声的随机逼近方案的渐近行为。我们证明了这样一个递归的线性插值轨迹是一个极限微分包含流的渐近伪轨迹,它是通过对递归的集值漂移函数求平均值而获得的,并考虑了马尔可夫噪声的平稳分布。然后利用Benaim的极限集定理,根据极限微分包含的动力学来刻画递归的极限集。然后,我们陈述了马尔可夫噪声假设的两种变体,在这两种变体下,递归的分析与本文提出的分析类似。递归自然出现的场景作为应用程序呈现。这些包括受控随机逼近、次梯度下降、近似漂移问题和不连续动力学分析,所有这些都是在存在非加性迭代相关马尔可夫噪声的情况下进行的。

理学硕士:

62L20型 随机近似
28B20型 集值集函数与测度;集值函数的积分;可测量的选择
第26页第25页 集值函数
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrieu,C。;Vihola,M.,带扩展投影的马尔科夫随机近似,伯努利,20545-585(2014)·Zbl 1316.62124号
[2] Aubin,J.P.,《生存理论》(2009年),施普林格科学与商业媒体:施普林格科技与商业媒体,纽约·Zbl 1179.93001号
[3] Aubin,J.P。;Cellina,A.,《差异包含:集值映射和生存理论》,264(2012),施普林格科学与商业媒体:施普林格科技与商业媒体,柏林,海德堡
[4] Benaim,M.,随机逼近的动力系统方法,SIAM J.控制优化。,34, 437-472 (1996) ·Zbl 0841.62072号
[5] 贝纳伊姆,m.,《概率研讨会》第三十三期,随机近似算法动力学,1-68(1999),施普林格:施普林格,柏林,海德堡·Zbl 0955.62085号
[6] 贝纳伊姆,m。;霍夫鲍尔,J。;Sorin,S.,《随机近似和微分包含》,SIAM J.Control Optim。,44, 328-348 (2005) ·Zbl 1087.62091号
[7] Bertsekas,D.P.,凸优化理论(2009),雅典娜科学贝尔蒙特:雅典娜科技贝尔蒙特,加利福尼亚州贝尔蒙特·Zbl 1242.90001号
[8] Borkar,V.S.,扩散过程的最优控制,皮特曼数学研究笔记203。36 Borkar V.(2005),1989(2005)
[9] Borkar,V.S.,“受控马尔可夫”噪声的随机近似,系统。控制信函。,55, 139-145 (2006) ·Zbl 1129.62407号
[10] Borkar,V.S.,《随机逼近:动力系统观点》(2008),剑桥大学出版社·Zbl 1181.62119号
[11] Borkar,V.S.,《概率论:高级课程》(2012),Springer科学与商业媒体:Springer科技与商业媒体,纽约
[12] 博卡尔,V.S。;Meyn,S.P.,随机逼近和强化学习收敛的ODE方法,SIAM J.控制优化。,38, 447-469 (2000) ·Zbl 0990.62071号
[13] G.福特。;Moulines,E。;Schreck,A。;Vihola,M.,马尔科夫随机逼近与间断动力学的收敛性,SIAM J.控制优化。,54, 866-893 (2016) ·Zbl 1334.90090号
[14] 李,S。;Y.Ogura。;Kreinovich,V.,集值和模糊集值随机变量的极限定理和应用,43(2013),施普林格科学与商业媒体:施普林格科技与商业媒体,荷兰
[15] Metivier,M。;Priouret,P.,Kushner和Clark引理在一般随机算法类中的应用,IEEE Trans。Inf.理论,30,140-151(1984)·Zbl 0546.62056号
[16] Meyn,S.P。;Tweedie,R.L.,《马尔可夫链与随机稳定性》(2012),施普林格科学与商业媒体:施普林格科技与商业媒体,伦敦
[17] 纳格尼,A。;Zhang,D.,投影动力系统和变分不等式及其应用,2(2012),Springer Science&Business Media
[18] Perkins,S。;Leslie,D.S.,带微分包含的异步随机逼近,随机系统。,2, 409-446 (2012) ·Zbl 1311.62125号
[19] 拉马斯瓦米,A。;Bhatnagar,S.,随机递归包含的Borkar-Meyn定理的推广(2015)
[20] Tadić,V.,《随机截断的随机近似、状态相关噪声和不连续动力学》,《随机学:Int,J.Probab》。随机过程。,64, 283-326 (1998) ·Zbl 1043.62526号
[21] 齐齐克利斯,J.N。;Van Roy,B.,《用函数逼近分析时间差分学习》,IEEE Trans-Autom。控制,42,674-690(1997)·兹比尔0914.93075
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。