×

随机寻根的一种新技术:使用自适应元搜索增强搜索。 (英语) Zbl 1434.90112号

摘要:在随机优化和控制领域中遇到的最基本的问题是随机寻根(SRF)问题,其中任务是为给定函数定位(或在控制上下文中移动)一个未知点,其(g(x^\ast)=0只有在有噪音的情况下才能观察到。随机优化和控制中SRF问题的大多数最新解决方案都涉及随机逼近理论。后一类算法的前提是通过所谓的“小步”过程进行操作,这些过程以保守的方式探索搜索空间。我们不依赖于成熟的随机近似理论,而是提倡一种完全不同的方法,该方法采用与噪声二分搜索类似的原理。在确定性二分搜索中,主要问题是通过询问Oracle最优点(x^\ast)是位于点(x\)的左侧还是右侧,来确定位于直线上的点(x*\ast\)。Waeber和他的同事研究了这个问题的一个噪音版本,其中Oracle给出了正确的概率响应。受这些作者的开创性工作及其在随机优化和控制中的潜在应用的启发,我们将SRF问题映射到一个有噪声的二分搜索问题,其中我们仅使用样本的符号信息来指导搜索。
我们的解决方案在每个历元处递归地将搜索空间缩小至少一个因子\(\ frac{2d}{3}\),其中\(d\geq2\)是算法的用户定义参数。我们的方案部分基于Oommen及其合著者最初提出的具有自适应搜索的连续点定位(CPL-A\(d\)S)。然而,由于SRF问题的固有不对称性,CPL-A\(d\)S的解决方案在这里不适用。我们的解决方案调用一个CPL-a\(d\)S-like解决方案将搜索间隔划分为\(d_\)个子间隔,使用学习自动机评估未知根相对于这些子间隔的位置,并通过消除至少一个分区来修剪每次迭代中的搜索空间。我们的方案,即SRF的CPL-A(d)S算法,表示为SRF-A(d。

MSC公司:

90立方厘米 随机规划
93埃99 随机系统与控制

软件:

PRMLT公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿夫沙尔,S。;莫斯利,M。;Kheyrandish,M.,提出一种新的基于学习自动机的多类分类器,神经计算,104,0,97-104(2013)
[2] 阿加切,M。;Oommen,B.J.,《广义追踪学习方案:连续和离散学习自动机的新家族》,IEEE Trans。系统。ManCybern。B部分,32,6,738-749(2002)
[3] Ben-Zvi,T。;Nickerson,J.,《决策分析:传感器放置的环境学习自动机》,IEEE Sens.J.,11,5,1206-1207(2011)
[4] Bertsekas,D.P.,《动态规划和最优控制》(2000),雅典娜科学出版社
[5] Bishop,C.M.,模式识别和机器学习(信息科学和统计)(2006年),Springer-Verlag New York,Inc.:Springer-Verlag New Yeork,Inc,美国新泽西州Secaucus·Zbl 1107.68072号
[6] Feige,美国。;拉加万,P。;佩莱格,D。;Upfal,E.,《含噪声信息的计算》,SIAM J.Compute。,23, 5, 1001-1018 (1994) ·Zbl 0813.68057号
[7] Graupe,D.,《人工神经网络原理》(2007),世界科学出版社:世界科学出版社,美国新泽西州River Edge·Zbl 1139.68399号
[8] Horstein,M.,使用无噪音反馈的顺序传输,IEEE Trans。Inf.理论,9,3,136-143(1963)·Zbl 0112.09105号
[9] 黄,D.-S。;Jiang,W.,在双重环境中固定动态参数的通用cpl-ads方法,系统。人类网络。B部分,42,5,1489-1500(2012)
[10] 基弗,J。;Wolfowitz,J.,回归函数最大值的随机估计,《数学年鉴》。统计,23,3,462-466(1952)·Zbl 0049.36601号
[11] 科帕梅根,E.E。;Flournoy,N.,用于选择具有最大成功概率的剂量的上下设计,Seq。分析。,78-96年1月27日(2008年)·Zbl 1142.62049号
[12] 库什纳,H.J。;Yin,G.,《随机逼近和递归算法及应用》,第35卷(2003),Springer·Zbl 1026.62084号
[13] Lakshmivarahan,S.,《学习算法理论与应用》(1981年),Springer-Verlag:Springer-Verlag纽约·Zbl 0471.68034号
[14] 兰科特,J.K。;Oommen,B.J.,离散估计学习自动机,IEEE Trans-Syst Man Cybern,SMC-22,1473-1483(1992)
[15] LaValle,S.M.,《规划算法》(2006),剑桥大学出版社:英国剑桥大学出版社·Zbl 1100.68108号
[16] Misra,S。;克利须那,P。;萨里萨,V。;Obaidat,M.,《学习自动机作为智能电网电源管理工具》,IEEE Commun。Mag.,51,1,98-104(2013)
[17] 纳伦德拉,K.S。;Annaswamy,A.M.,《稳定自适应系统》(1989),普伦蒂斯·霍尔:新泽西州普伦蒂斯霍尔·Zbl 0758.93039号
[18] 尼古波利迪斯,P。;卡卡利,V。;Papadimitriou,G。;Pomportsis,A.,《通过智能天线提高无线推送系统的性能》,IEEE Trans。社区。,60, 2, 312-316 (2012)
[19] 尼古波利迪斯,P。;Papadimitriou,G。;Pomportsis,A。;Sariginannidis,P。;Obaidat,M.,《使用学习自动机的自适应无线网络》,IEEE无线通信。,18, 2, 75-81 (2011)
[20] Oommen,B。;Agache,M.,《连续和离散追踪学习方案:各种算法及其比较》,IEEE Trans。系统。人类网络。B部分,31,3,277-287(2001)
[21] Oommen,B.J.,吸收和遍历离散化双作用学习自动机,IEEE Trans。系统。人类网络。,SMC-16282-293(1986)·Zbl 0607.68041号
[22] Oommen,B.J.,在线随机搜索及其在非线性优化参数学习中的应用,IEEE Trans。系统。人类网络。,SMC-27B,733-739(1997)
[23] 奥门,B.J。;Hansen,E.,离散化线性奖励学习自动机的渐近最优性,IEEE Trans。系统。人类网络。,SMC-143(1986)·兹伯利0555.68025
[24] 奥门,B.J。;Lanctôt,J.K.,离散追求学习自动机,IEEE Trans。系统。人类网络。,SMC-20,4931-938(1990)·Zbl 0709.68064号
[25] 奥门,B.J。;Raghunath,G.,《随机点位置的自动学习和智能三级搜索》,IEEE Trans。系统。人类网络。,SMC-28B,947-954(1998)
[26] 奥门,B.J。;Raghunath,G。;Kuipers,B.,《随机教师和随机强迫说谎者的参数学习》,IEEE Trans。系统。人类网络。,SMC-36B,820-836(2006)
[27] Parker,J.,《图像处理和计算机视觉算法》(2010),John Wiley&Sons
[28] Phillips,R.,《定价和收入优化》,斯坦福商业图书(2005),斯坦福大学出版社
[29] Pichitlamken,J。;Nelson,B.L.,《通过模拟进行优化的组合程序》,ACM Trans。模型。计算。模拟。(TOMACS),13,2,155-179(2003)·兹比尔1390.65024
[30] Prudius,A.A。;Andradóttir,S.,使用平衡探索和开发搜索进行模拟优化,第36届冬季模拟会议论文集,545-549(2004),冬季模拟会议
[31] 罗宾斯,H。;Monro,S.,《随机近似方法》,Ann.Math。统计,400-407(1951)·Zbl 0054.05901号
[32] Sawaragi,Y。;Baba,N.,关于变结构随机自动机学习行为的注释,IEEE Trans。系统。人类网络。,3, 644-647 (1973) ·Zbl 0286.94052号
[33] 《机器人手册》(Siciliano,B.;Khatib,O.(2008),施普林格,柏林,海德堡,德国)·Zbl 1171.93300号
[34] Spall,J.C.,《随机搜索和优化简介:估计、模拟和控制》,第65卷(2005),John Wiley&Sons
[35] Thathachar,M.A.L。;Oommen,B.J.,《离散奖励式学习自动机》,J.Cybern。信息科学。,24-29 (1979)
[36] Tilak,O。;马丁·R。;Mukhopadhyay,S.,学习自动机游戏的分散间接方法,IEEE Trans。系统。人类网络。,41, 5, 1213-1223 (2011)
[37] Torkestani,J.A。;Meybodi,M.R.,基于学习自动机的随机图最小权连通支配集的发现,Inf.Sci。,200, 0, 57-77 (2012) ·Zbl 1248.05131号
[38] Tsiligkaridis,T。;萨德勒,B.M。;Hero,A.O.,关于目标定位的合作20个问题,IEEE Trans。Inf.理论,60,42233-252(2014)·Zbl 1360.94116号
[39] 韦伯,R。;弗雷泽,P.I。;Henderson,S.G.,《随机寻根的贝叶斯方法》,《2011年冬季模拟会议论文集》,4033-4045(2011),IEEE
[40] 韦伯,R。;弗雷泽,P.I。;Henderson,S.G.,Bisection搜索与噪音响应,SIAM J.Control Optim。,51, 3, 2261-2279 (2013) ·Zbl 1272.93133号
[41] Xu,Y。;Wang,J。;吴琼。;Anpalagan,A。;Yao,Y.-D.,未知动态环境中的机会主义频谱接入:游戏理论随机学习解决方案,IEEE Trans。无线通信。,1380-1391年11月4日(2012年)
[42] Yazidi,A。;O.格拉莫。;John Oommen,B。;Goodwin,M.,使用分层搜索方案解决随机点位置问题的新策略,IEEE Trans。赛博。,44, 11, 2202-2220 (2014)
[43] Yazidi,A。;科罗拉多州格拉莫。;Oommen,B.J.,《随机环境中的服务选择:基于学习自动机的解决方案》,应用。智力。,36, 617-637 (2012)
[44] 周,P。;Chang,Y。;Copeland,J.,认知无线电网络中重复功率控制游戏的强化学习,IEEE J.Sel。公共区域。,30, 1, 54-69 (2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。