×

通过Alekseev公式进行随机近似的集中界。 (英语) Zbl 1442.62187号

小结:给定一个常微分方程(ODE)及其摄动,Alekseev公式将后者的解表示为与前者相关的解。利用这个公式和一个新的鞅微分集中不等式,我们发展了一种分析非线性随机逼近(SA)的新方法。该方法有助于研究SA接近其极限常微分方程局部渐近稳定平衡点(LASE)的行为;这个LASE不一定是限制ODE的唯一吸引子。作为应用,我们获得了非线性SA的一个新的浓度界。也就是说,给定(ε>0)并且当前迭代位于LASE的邻域,我们提供了(i)击中该LASE的ε球所需的时间的估计,以及(ii)在这段时间之后,迭代确实在这个(epsilon)球中并在此后停留在那里的概率。后一种估计也可以被视为“锁定”概率。与相关结果相比,我们的浓度边界更紧,并且在明显较弱的假设下保持不变。特别是,即使步长不是平方和,我们的界限也适用。尽管假设较弱,但我们证明著名的Kushner-Clark引理仍然成立。

MSC公司:

62L20型 随机近似
93-08 系统和控制理论相关问题的计算方法
60G42型 离散参数鞅
34D10号 常微分方程的摄动
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alekseev VM(1961)常微分方程解的扰动估计(俄语)。Westnik Moskov大学。1:28-36.谷歌学者
[2] 亚瑟·WB(1994)经济中的收益递增与路径依赖(密歇根大学出版社,安娜堡)。谷歌学者
[3] Artur B,Ermol’ev YM,Kaniovskii YM(1983),广义urn问题及其应用。控制论系统分析。19(1):61-71.谷歌学者·兹比尔0534.90049
[4] Bainov DD,Simeonov PS(1992)积分不等式及其应用(柏林施普林格)。谷歌学者·Zbl 0759.26012号
[5] Benaïm m(1999)随机逼近算法动力学。概率学院三十三(纽约州施普林格市),1-68.谷歌学者·兹比尔0955.62085
[6] Benveniste A,Métiver M,Priouret P(1990)自适应算法和随机逼近(柏林施普林格)。谷歌学者·Zbl 0752.93073号
[7] Borkar VS(2008)随机近似(印度新德里印度斯坦出版局)。谷歌学者·Zbl 1159.60002号
[8] Borkar VS,Pattathil S(2018),双时间尺度随机近似的浓度界限。arXiv:1806.10798谷歌学者
[9] Bovier A,den Hollander F(2016)亚稳定性:一种潜在的理论方法《德国数学杂志》,第351卷(纽约施普林格出版社)。谷歌学者
[10] Brauer F(1966)非线性微分方程组的微扰。数学杂志。分析。申请。14(2):198-206.谷歌学者·Zbl 0156.09805号
[11] Breiman L(1992)概率1968年再版(SIAM,费城)。谷歌学者
[12] 陈海飞(2002)随机逼近及其应用(荷兰多德雷赫特Kluwer学院)。谷歌学者·Zbl 1008.62071号
[13] Dalal G,Szörényi B,Thoppe G,Mannor S(2018a)利用函数近似对TD(0)进行有限样本分析。科恩A编辑。程序。第32届AAAI人工智能大会(AAAI Press,Palo Alto,CA),6144-6160.谷歌学者
[14] Dalal G,Thoppe G,Szörényi B,Mannor S(2018b)双时间尺度随机逼近的有限样本分析及其在强化学习中的应用。程序。机器学习。雷斯.75:1199-1233.谷歌学者
[15] 迪弗洛M(1997)随机迭代模型(柏林施普林格)。谷歌学者·Zbl 0868.62069号
[16] Fathi M,Frikha N(2013),随机近似方案的运输能力不等式和偏差估计。电子J.Probab。18:1-36.谷歌学者·Zbl 1284.60137号
[17] 佛罗里达州弗雷德林,文策尔州(2014)动力系统的随机扰动(纽约州施普林格)。谷歌学者
[18] Frikha N,Menozzi S(2012)随机近似的浓度界限。电子通信概率。17:1-15.谷歌学者·Zbl 1252.60065号
[19] Gelfand SB,Mitter SK(1991)Rd中全局优化的递归随机算法。SIAM J.控制优化。29(5):999-1018.谷歌学者·Zbl 0753.65051号
[20] Herrmann S、Imkeller P、Pavlyukevich I、Peithmann D(2013)随机共振:小噪声极限的数学方法,《数学调查与专著》,第194卷(美国数学学会,罗得岛州普罗维登斯)。谷歌学者
[21] Kamal S(2010)关于随机逼近的收敛性、锁定概率和样本复杂性。SIAM J.控制优化。48(8):5178-5192.谷歌学者·Zbl 1208.62128号
[22] Khalil HK(2001)非线性系统第三版(新泽西州上鞍河普伦蒂斯·霍尔)。谷歌学者
[23] 克拉索夫斯基NN(1963)运动稳定性(斯坦福大学出版社,加利福尼亚州斯坦福)。谷歌学者·Zbl 0109.06001号
[24] Kumar B,Borkar V,Shetty A(2018),恒定步长随机近似下跟踪误差的界。arXiv:1802.07759.谷歌学者
[25] 库什纳·HJ,克拉克·DS(1978)约束和非约束系统的随机逼近方法(纽约州施普林格)。谷歌学者·Zbl 0381.60004号
[26] Kushner HJ,Yin G(2003)随机逼近和递归算法及其应用第二版(纽约州施普林格)。谷歌学者·Zbl 1026.62084号
[27] Lakshmikantham V,Deo S(1998)动力系统参数的变分方法(CRC出版社,佛罗里达州博卡拉顿)。谷歌学者·Zbl 0920.34001号
[28] Liu Q,Watbled F(2009)鞅的指数不等式和随机环境中定向聚合物自由能的渐近性质。随机过程及其应用。119(10):3101-3132.谷歌学者·Zbl 1177.60043号
[29] Miclo L(1992年a)《无电位器的模拟电路》(Recuit simuésans potentel sur un ensembly fini)。斯特拉斯堡Séminaire ProbabilitéS Strasbourg26:47-60.谷歌学者·Zbl 0770.60090号
[30] Miclo L(1992年b月)《无电势差的相似性》(Recuit simués sans potentel sur une variétériemannine compacte)。随机性随机报告。41(1/2):23-56谷歌学者·Zbl 0758.60033号
[31] Polyak BT,Juditsky AB(1992)通过平均加速随机近似。SIAM J.控制优化。30(4):838-855.谷歌学者·Zbl 0762.62022号
[32] Robbins H,Monro S(1951)随机近似方法。安。数学。统计人员。22(3):400-407.谷歌学者·兹比尔0054.05901
[33] Teschl G(2012)常微分方程与动力系统《数学研究生》,第140卷(美国数学学会,普罗维登斯,RI)。谷歌学者·Zbl 1263.34002号
[34] Vapnik V(2013)统计学习理论的本质(Springer Science&Business Media,纽约)·Zbl 0934.62009号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。