×

一种新的用于函数优化的连续动作集学习自动机。 (英语) Zbl 1173.90486号

小结:我们研究了一种基于连续动作集学习自动机的自适应随机搜索方法,用于解决参数空间中只有函数在任意选定点的噪声破坏值可用的随机优化问题。我们首先介绍了一种新的连续动作集学习自动机(CALA)并研究了其收敛性。然后我们给出了一个优化未知函数的算法。

MSC公司:

90立方厘米 随机规划

软件:

CALA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 库什纳,H.J。;Yin,G.G.,《随机近似算法与应用》,《数学应用》(1997),施普林格出版社:纽约施普林格·Zbl 0914.60006号
[2] Narendra,K.S。;Thathachar,K.S.,《学习自动化:导论》(1989),普伦蒂斯·霍尔:普伦蒂斯霍尔纽约
[3] Najim,K。;Pozyak,A.S.,《学习自动机:理论与应用》(1994),佩加蒙出版社:牛津佩加蒙出版公司
[4] Thathachar,M.A.L。;Sastry,P.S.,《学习自动机的种类:概述》,IEEE Trans。系统。人类网络-B部分:控制论,32711-722(2002)
[5] 巴托,A.G。;Anandan,P.,模式识别随机学习自动机,IEEE Trans。系统。人类网络。,SMC-15360-375(1985)·Zbl 0561.68042号
[6] Thathachar,M.A.L。;Sastry,P.S.,《通过自动机合作游戏学习最佳判别函数》,IEEE Trans。系统。人类网络。,SMC-17、73-85(1987)·Zbl 0633.68047号
[7] Najim,K。;Pozyak,A.S.,基于连续输入和改变动作数的学习自动机的多模态搜索技术,IEEE Trans。系统。人类网络-B部分:控制论,26,666-673(1996)
[9] Vasilakos,A。;Loukas,N.H.,ANASA-实值神经计算的随机增强算法,IEEE Trans。神经网络,7830-842(1996)
[10] Santharam,G。;Sastry,P.S。;Thathachar,M.A.L.,随机优化的连续动作集学习自动机,J.Franklin Inst.,331B,5,607-628(1994)·Zbl 0838.93083号
[11] Rajaraman,K。;Sastry,P.S.,连续和离散变量的随机优化及其在噪声下概念学习中的应用,IEEE Trans。系统。人类网络-A部分:系统和人类,29542-553(1999)
[13] Thathachar,M.A.L。;Ramakrishnan,K.R.,《学习自动机的分层系统》,IEEE Trans。系统。人类网络。,SMC-11236-248(1981)·Zbl 0457.68047号
[14] Oommen,B.J。;Hansen,E.,离散化线性回报学习自动机的渐近最优,IEEE Trans。系统。人类网络。,SMC-14542-545(1984)·Zbl 0555.68025号
[15] Thathachar,M.A.L。;Sastry,P.S.,《设计学习自动机强化方案的新方法》,IEEE Trans。系统。人类网络。,SMC-15168-175(1985)·Zbl 0572.68046号
[16] Papadimitriou,G.I.,《设计学习自动机强化方案的新方法:随机估计学习算法》,IEEE Trans。知识。数据工程,6649-654(1994)
[17] 兰科特,J.K。;Oommen,B.J.,离散估计学习自动机,IEEE Trans。系统。人类网络。,22, 1473-1483 (1992)
[18] Oommen,B.J。;Lanctot,J.K.,离散追踪学习自动机,IEEE Trans。系统。人类网络。,20, 931-938 (1990) ·Zbl 0709.68064号
[19] Papadimitriou,G.I.,具有快速收敛性和高精度的分层追踪非线性自动机,IEEE Trans。知识。数据工程,6654-659(1994)
[20] Oommen,B.J。;Agache,M.,《连续和离散追踪学习方案:各种算法及其比较》,IEEE Trans。系统。人类网络-B部分:控制论,31,277-287(2001)
[21] 阿加切,M。;Oommen,D.J.,《广义追踪学习方案:连续和离散学习自动机的新家族》,IEEE Trans。系统。曼赛本-B部分:控制论,32738-749(2002)
[22] 豪厄尔,M.N。;弗罗斯特,G.P。;戈登·T·J。;吴庆华,连续动作强化学习在汽车悬架控制中的应用,机电一体化,7,3,263-276(1997)
[23] 内泽尔尼茨基,O.V。;Narendra,K.S.,数据通信网络中学习自动机路由的非平稳模型,IEEE Trans。系统。人类网络。,SMC-17004-2015(1987)
[24] Obaidat,M.S。;Papadimitriou,G.I。;Pomportsis,A.S。;Laskaridis,H.S.,《共享介质ATM交换机基于学习自动机的总线仲裁》,IEEE Trans。系统。人类网络-B部分:控制论,32,815-820(2002)
[25] Papadimitriou,G.I。;Obaidat,M.S。;Pomportsis,A.S.,《广播网络控制中学习自动机的使用:方法论》,IEEE Trans。系统。人类网络-B部分:控制论,32,781-790(2002)·Zbl 1003.68727号
[26] Oommen,B.J。;de St.Croix,E.V.,使用学习自动机的图形分区,IEEE Trans。计算。,195-208年(1996年)·兹比尔1068.68676
[29] Oommen,B.J。;Roberts,T.D.,容量分配问题的连续学习自动机解决方案,IEEE Trans。计算。,49, 608-620 (2000)
[30] Oommen,B.J。;Roberts,T.D.,优先网络容量分配问题的离散学习自动机解决方案,IEEE Trans。系统。人类网络-B部分:控制论,32,821-831(2002)
[31] Meybodi,M.R。;Beigy,H.,《使用学习自动机的神经网络工程:确定三层前馈神经网络的期望大小》,J.Faculty Eng.,34,1-26(2001)
[32] Meybodi,M.R。;Beigy,H.,基于学习自动机的BP参数自适应方案注释,《神经计算杂志》,48,957-974(2002)·Zbl 1006.68749号
[33] Meybodi,M.R。;Beigy,H.,用于自适应反向传播算法参数的新的基于学习自动机的算法,Int.J.Neural Syst。,12, 45-68 (2002) ·Zbl 1006.68749号
[34] Beigy,H。;Meybodi,M.R.,使用学习自动机的反向传播算法自适应参数,国际神经系统杂志。,11, 219-228 (2001) ·Zbl 0991.68059号
[35] Beigy,H。;Meybodi,M.R.,自适应均匀分数信道算法,伊朗。J.电气计算。工程,347-53(2004)·Zbl 1202.90051
[39] Papoulis,A.,《概率、随机变量和随机过程》(1965年),McGraw-Hill:McGraw-Hill纽约·Zbl 0191.46704号
[40] Doob,J.L.,《随机过程》(1953),威利出版社:威利纽约·Zbl 0053.26802号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。