×

随机优化/近似算法如何适应具有跳马尔可夫样本路径的随机演化最优/根。 (英语) Zbl 1161.62047号

摘要:当一个合适的函数或其根是常数或根据缓慢时变的连续样本路径随机演化时,随机优化/近似算法被广泛用于递归估计噪声观测下的函数或它的根的最佳值。相比之下,本文分析了随机优化/近似算法在非光滑(跳跃)样本路径快速演化时递归估计最优值或根的渐近性质。由此产生的问题属于具有两个时间尺度的寄存器切换随机近似算法。
受无线通信和系统识别中新兴应用的启发,我们分析了此类算法的渐近行为。我们的分析假设,噪声观测值包含一个(非光滑)跳跃过程,该跳跃过程由离散时间马尔可夫链建模,其过渡频率变化比随机优化算法的自适应速度快得多。利用随机平均,证明了算法的收敛性。该算法的收敛速度是通过估计误差的界和扩散近似得到的。文中还讨论了通过迭代平均提高收敛速度的方法,以及用微分包含表示的极限平均动力学。

MSC公司:

62L20型 随机近似
34A60型 普通微分夹杂物
93年20日 最优随机控制
60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程)
90立方厘米 随机规划
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Benveniste A.、Metivier M.和Priouret P.(1990年)。自适应算法和随机近似。纽约州施普林格·Zbl 0639.93002号
[2] Billingsley P.(1968)。概率测度的收敛性。纽约威利·Zbl 0172.21201号
[3] Buche R.和Kushner H.J.(2000年)。竞争资源共享系统中的随机近似和用户适应。IEEE传输。自动。控制45:844–853·Zbl 0967.90022号 ·数字对象标识代码:10.1109/9.855546
[4] 陈海峰(2002)。随机近似及其应用。多德雷赫特Kluwer学院·Zbl 1008.62071号
[5] Chin,D.C.,Maryak,J.T.:随机近似中迭代平均的注意事项。In:INFORMS年会第5-8页(1996年)
[6] Chung K.L.(1954年)。关于随机近似方法。安。数学。统计数字25:463–483·Zbl 0059.13203号 ·doi:10.1214/aoms/1177728716
[7] Dippon J.和Renz J.(1997年)。最小值随机逼近中的加权平均值。SIAM J.控制优化。35: 1811–1827 ·Zbl 0885.62094号 ·doi:10.137/S0363012995283789
[8] Ephraim Y.和Merhav N.(2002年)。隐马尔可夫过程。IEEE传输。通知。理论48:1518–1569·Zbl 1061.94560号 ·doi:10.1109/TIT.2002.1003838
[9] Haykin S.(2005)。认知无线电:大脑授权的无线通信。IEEE J.选择。公共区域。23: 201–220 ·doi:10.1109/JSAC.2004.839380
[10] Krishnamurthy V.和Rydén T.(1998年)。线性和非线性自回归模型的马尔可夫一致估计。J.时间序列。分析。19: 291–308 ·Zbl 0906.62088号 ·数字对象标识代码:10.1111/1467-9892.00093
[11] Krishnamurthy V.和Yin G.(2002年)。隐马尔可夫模型和马尔可夫状态自回归模型估计的递归算法。IEEE传输。通知。理论48(2):458–476·Zbl 1071.62502号 ·doi:10.1109/18.979322
[12] Krishnamurthy V.,Yin G.(2006)控制隐马尔可夫模型,用于动态适应膜片钳实验,以估计单离子通道的能斯特电位。IEEE传输。纳米生物学。5, 115–125 (2006) ·doi:10.1109/TNB.2006.875038
[13] Krishnamurthy V.、Wang X.和Yin G.(2004)。基于离散随机近似的CDMA扩频码优化与自适应。IEEE传输。通知。理论50:1927-1949·Zbl 1297.94011号 ·doi:10.1109/TIT.2004.833338
[14] 库什纳·H·J(1984)。随机过程的逼近和弱收敛方法及其在随机系统理论中的应用。麻省理工学院出版社,剑桥·Zbl 0551.60056号
[15] Kushner H.J.和Huang H.(1981)。常系数随机逼近的渐近性质。SIAM J.控制优化。19: 87–105 ·Zbl 0475.93082号 ·doi:10.1137/0319007
[16] Kushner H.J.和Yang J.(1993年)。迭代平均的随机逼近:一般过程的最佳渐近收敛速度。SIAM J.控制优化。31: 1045–1062 ·Zbl 0788.62078号 ·数字对象标识代码:10.1137/0331047
[17] Kushner H.J.和Yin G.(2003年)。随机近似和递归算法及应用。第2版。纽约州施普林格·Zbl 1026.62084号
[18] Nevel's son,M.B.,Khasminskii,R.Z.:随机近似和递归估计。数学翻译。专著,第47卷。AMS,普罗维登斯(1976)
[19] 波利亚克B.T.(1990)。随机近似类型的新方法。自动。遥控器51:937–946·兹比尔0737.93080
[20] Polyak B.T.和Juditsky A.B.(1992年)。通过平均加速随机近似。SIAM J.控制优化。30: 838–855 ·Zbl 0762.62022号 ·数字对象标识代码:10.1137/0330046
[21] Ruppert D.(1991)。随机近似。收录于:Ghosh,B.K.和Sen,P.K.(编辑)《序列分析手册》。,第503-529页。Marcel Dekker,纽约
[22] Schwabe R.(1993)。平滑随机近似过程的稳定性结果。Z.安圭。数学。机械。73: 639–644 ·Zbl 0793.65110号
[23] Spall J.C.(1992年)。使用同时扰动梯度近似的多元随机近似。IEEE传输。自动。控制AC-37:332–341·Zbl 0745.60110号 ·doi:10.1109/9.119632
[24] Spall J.C.(2003)。随机搜索和优化导论:估计、模拟和控制。纽约威利·邮编1088.90002
[25] Tarighat A.和Sayed A.H.(2004年)。通信系统中应用的最小平均相位自适应滤波器。IEEE信号处理。莱特。11: 220–223 ·doi:10.1010/LSP.2003.821732
[26] 尹刚(1990)。Robbins–Monro方法的停止规则。J.优化。理论应用。67: 151–173 ·Zbl 0687.62068号 ·doi:10.1007/BF00939741
[27] 尹刚(1991)。关于Polyak平均方法对随机近似的推广。斯托克。斯托克。代表36:245–264·Zbl 0749.62055号
[28] 尹刚(1999)。一类全局随机优化算法的收敛速度。SIAM J.Optim公司。10: 99–120 ·Zbl 0958.60020号 ·doi:10.1137/S1052623497319225
[29] Yin G.和Krishnamurthy V.(2005)。慢变马尔可夫参数LMS算法分析——跟踪慢隐马尔可夫模型和DS/CDMA中的自适应多用户检测。IEEE传输。通知。理论51:2475–2490·Zbl 1283.94024号 ·doi:10.1109/TIT.2005.850075
[30] Yin G.和Krishnamurthy V.(2005年)。具有马尔可夫状态切换极限的最小均方算法。IEEE传输。自动。控制50:577–593·Zbl 1365.93555号 ·doi:10.1109/TAC.2005.847060
[31] Yin G.和Zhang Q.(2005)。离散时间马尔可夫链:双时间尺度方法和应用。纽约州施普林格·Zbl 1072.60002号
[32] Yin G.、Krishnamurthy V.和Ion C.(2004年)。体制切换随机近似算法及其在自适应离散随机优化中的应用。SIAM J.Optim公司。14: 1187–1215 ·Zbl 1112.62330号 ·doi:10.1137/S1052623403423709
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。