×

跟踪移动代理的常步长随机近似的非症状误差界。 (英语) Zbl 1426.93313号

摘要:这项工作重新审视了用于跟踪缓慢移动目标的恒定步长随机近似算法,并使用Alekseev非线性常数变化公式获得了对整个时间轴有效的跟踪误差的界限。这是整个时间轴的第一个非渐近界,因为它不像以前的工作那样基于消失步长极限和相关极限定理,并且清楚地捕捉到了对问题参数和维数的依赖性。

MSC公司:

93E03型 控制理论中的随机系统(一般)
93甲14 分散的系统
93立方厘米 由常微分方程控制的控制/观测系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alekseev VM(1961)常微分方程解的扰动估计。Westnik Moskov Unn Ser西尼克·莫斯科夫·恩塞尔1:28-36
[2] Anantharam V,Borkar VS(2012),具有长程相关和重尾噪声的随机近似。排队系统71(1-2):221-242·Zbl 1275.60053号
[3] Bach F.Moulines E(2013)收敛速度为O(1/n)的非严格凸光滑随机逼近。主题:神经信息处理系统的进展,第773-781页
[4] Benveniste A(1987)时变系统跟踪的自适应算法设计。国际J自适应控制信号过程19(1):3-29·Zbl 0738.93041号
[5] Benveniste A,Ruget G(1982)常增益递归随机算法跟踪能力的度量。IEEE Trans Autom Control 47(3):639-649·Zbl 0495.93070号
[6] Borkar VS(2002)关于随机近似的捕获概率。综合概算计算11(1):11-20·Zbl 0988.62052号
[7] Borkar AV,Borkar VS,Sinha A(2019)使用椭圆轨道对缓慢移动的车队进行空中监测。欧洲药典控制46(2):90-102·Zbl 1412.93004号
[8] Borkar VS(2008)随机近似:动力学系统的观点。印度斯坦出版社和剑桥大学出版社,新德里和剑桥·Zbl 1181.62119号
[9] Borkar VS,Meyn SP(2000)随机逼近和强化学习收敛的ODE方法。SIAM J控制优化38(2):447-469·Zbl 0990.62071号
[10] Brauer F(1966)非线性微分方程组的扰动。数学分析应用杂志14(2):198-206·Zbl 0156.09805号
[11] Bucklew JA,Kurtz TG(1993)固定步长递归算法的弱收敛性和局部稳定性。IEEE Trans-Inf理论39(3):966-978·兹比尔0792.93116
[12] Burke WL(1971)使用匹配的渐近展开式计算缓慢运动系统的引力辐射阻尼。数学物理杂志12(3):401-418
[13] 查佩尔,CF;Ray,PS(编辑),准静态对流事件,289-310(1986),纽约
[14] 陈汉福(2006)随机逼近及其应用。纽约州施普林格
[15] Derevitskii DP,Fradkov AL(1974)两个模型分析了自适应算法的动态。自动遥控器35(1):59-67·Zbl 0282.93030号
[16] Diamantaras KI,Kung SY(1996)主成分神经网络:理论与应用。纽约威利·Zbl 0911.68157号
[17] Eweda E(1994)跟踪随机时变信道的RLS、LMS和符号算法比较。IEEE传输信号处理42(11):2937-2944
[18] Farden D(1981)自适应信号处理算法的跟踪特性。IEEE Trans-Acoust语音信号处理29(3):439-446·Zbl 0524.94004号
[19] Finnoff W(1993)常学习率反向传播算法的扩散近似和对局部极小值的抵抗。摘自:神经信息处理系统的进展,第459-466页
[20] Guo L,Ljung L(1995)一般跟踪算法的指数稳定性。IEEE Trans Autom Control 40(8):1376-1387·Zbl 0834.93059号
[21] Guo L,Ljung L(1995)通用跟踪算法的性能分析。IEEE Trans Autom Control 40(8):1388-1402·兹比尔083493050
[22] 郭磊,Ljung L,Wang G-J(1997)LMS稳定性的充要条件。IEEE Trans Autom Control 42(6):761-770·Zbl 0886.93073号
[23] Joslin JA,Heunis AJ(2000)常增益线性随机梯度算法的重对数定律。SIAM J控制优化39(2):533-570·Zbl 0966.60023号
[24] Joulin A(2007)关于稳定随机积分的极大不等式。潜在分析26(1):57-78·Zbl 1117.60019号
[25] Kuan CM,Hornik K(1991)学习算法与恒定学习率的收敛性。IEEE Trans Neural Netw 2(5):484-489
[26] Kushner HJ,Hai H(1981)学习和自适应系统渐近分析的平均方法,调整率较小。SIAM J控制优化19(5):635-650·Zbl 0498.93053号
[27] Kushner HJ,Huang H(1981)常系数随机近似的渐近性质。SIAM J控制优化19(1):87-105·Zbl 0475.93082号
[28] Kushner HJ,Yin GG(1997),随机近似算法和应用。纽约州施普林格·Zbl 0914.60006号
[29] Laxminarayanan C,Szepesvari C(2018)线性随机近似:常数步长和迭代平均能走多远?附:第21届国际人工智能与统计会议(AISTATS)会议记录
[30] Liu Q,Watbled F(2009)鞅的指数不等式和随机环境中定向聚合物自由能的渐近性质。Stoch Process他们的应用119(10):3101-3132·Zbl 1177.60043号
[31] Ljung L(1977)递归随机算法分析。IEEE Trans Autom Control 22(4):551-575·Zbl 0362.93031号
[32] Ng SC,Leung SH,Luk A(1999)学习速率恒定的快速收敛广义反向传播算法。神经过程Lett 9(1):13-23
[33] Peuteman J,Aeyels D(2002)慢时变非线性系统的指数稳定性。数学控制信号系统15:202-228·Zbl 1019.93050号
[34] Pflug GCh(1986)常步长随机最小化:渐近定律。SIAM J控制优化24(4):655-666·Zbl 0594.90089号
[35] Pflug GCh(1990)常步长随机近似算法的非症状置信界。Monatsheft für Mathematik修道院110(3):297-314·兹比尔0716.62081
[36] Robbins H,Monro J(1951)随机近似方法。数学年鉴22(3):400-407·Zbl 0054.05901号
[37] Rugh WJ(1993)线性系统理论。新泽西州恩格尔伍德悬崖普伦蒂斯·霍尔
[38] Sharma R,Sethares WA,Bucklew JA(1996)具有一般成本函数的基于随机梯度的自适应滤波算法的渐近分析。IEEE传输信号处理44(9):2186-2194
[39] Victor,Solo(1994)关于慢时变线性系统的稳定性,控制、信号和系统数学(MCSS),7.4,pp.331-350·Zbl 0833.93047号
[40] Thoppe G,Borkar VS(2019)通过Alekseev公式进行随机近似的浓度界。烟囱系统9(1):1-26·Zbl 1442.62187号
[41] Utkin V,Guldner J,Shi J(2017),机电系统中的滑模控制。博卡拉顿CRC出版社
[42] Wilson C、Veeravalli V、Nedic A(2018)自适应顺序随机优化。IEEE Trans Autom Control 64(2):496-509·兹比尔1482.90129
[43] Yin G,Ion C,Krishnamurthy V(2009)随机优化/近似算法如何适应具有跳跃马尔可夫样本路径的随机进化最优/根。数学课程120(1):67-99·Zbl 1161.62047号
[44] Yin G,Krishnamurthy V,Ion C(2004)体制切换随机近似算法及其在自适应离散随机优化中的应用。SIAM J Optim公司14(4):1187-1215·Zbl 1112.62330号
[45] Zerihun T,Ladde GS(2013)非线性随机微分方程解的基本性质和参数变化方法。动态系统应用程序22:433-458·Zbl 1306.60083号
[46] 周B(2016)关于线性时变系统的渐近稳定性。自动化68:266-276·Zbl 1334.93152号
[47] Zhou B(2017)利用不定导数Lyapunov函数进行非线性时变系统的稳定性分析。IET控制理论应用9:1434-1442
[48] 朱J,Spall JC(2016)恒增益随机梯度算法的跟踪能力。致:第55届IEEE决策与控制会议(CDC),拉斯维加斯,第4522-4527页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。