×

不稳定平衡未知系统的基于模拟学习的情感控制器。 (英语) Zbl 1197.93032号

摘要:对于具有不稳定平衡点的未知系统,智能控制并不总是一种合适的控制策略,这在许多情况下会导致性能下降。由于该程序在以前的学习期间存在试错方式,这种寻找合适控制信号的探索可能会导致不稳定。然而,最近提出的情绪控制器能够快速学习;使用这些控制器并不是解决上述不稳定性问题的有效方法。因此,需要一种解决方案来避免学习初期的不稳定性。本文的目的是提出一种用无模型控制器控制不稳定系统或具有不稳定平衡的系统的新方法。
在第一步中,将一个性能有限的现有控制器(基于模型的控制器)用作情感学习控制器的指导者。此学习阶段使控制器做好控制设备和指导者的准备,同时防止任何不稳定。当情感控制器能够正确模拟基于模型的控制器的行为时,使用模糊推理系统(FIS)将所使用的控制器从基于模型的情感控制器轻轻切换到情感控制器。此外,情绪压力从导师-模仿者输出差异轻轻地转换为目标组合。本文中,通过使用目标的非线性组合和对FIS施加不同的压力来调节压力,产生一次情绪压力,并使这些目标的子集在当前情况下更加突出。
该无模型控制器用于控制倒立摆系统和具有不稳定平衡的振荡器。值得注意的是,所提出的控制器是一个无模型控制器,并且不使用任何有关工厂的知识。在两个基准上的实验结果表明,在所有操作条件下,与基于模型的最初提供的控制器和带有非线性应力产生单元的情感控制器相比,所提出的具有模糊应力产生机制的模拟和情感控制器具有优越性。
本文讨论了两个用于评估所提出的无模型控制器性能的试验台:一个是实验室倒立摆系统,它是一个具有不稳定平衡点的著名系统,另一个是蔡氏电路,它是具有两个稳定平衡点和一个不稳平衡点的振荡器。结果表明,基于上述策略的控制器能够对系统进行满意的控制。
本文提出了一种用无模型控制器控制不稳定系统或具有不稳定平衡的系统的新方法。这种方法基于学习初期的模仿学习和向交互式情感学习的软转换。此外,FIS还用于对目标的优势和情境重要性的语言知识进行建模。这些FIS用于为情绪控制者注意调节压力信号。该策略在两个基准上的结果表明了该无模型控制策略的有效性。

MSC公司:

93A10号 一般系统
68T05型 人工智能中的学习和自适应系统
93立方厘米 模糊控制/观测系统
2005年第70季度 机械系统的控制

软件:

模仿者
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arami,A.、Javan Roshtkhari,M.和Lucas,C.(2008),“基于融合情感的快速无模型智能控制器:实际案例实施”,第16届地中海控制与自动化会议论文集,法国阿雅克肖,第596-602页·doi:10.1109/MED.2008.4602225
[2] Balkenius,C.和Moren,J.(1998),“大脑中情绪调节的计算模型”,《适应系统中情绪基础研讨会论文集》,瑞士苏黎世。
[3] DOI:10.1080/1969720118947·doi:10.1080/01969720118947
[4] Behenke,S.和Bennewitz,M.(2005年),“使用模拟强化学习踢足球”,《机器人与自动化国际会议论文集》,通过演示机器人编程的社会方面研讨会,西班牙巴塞罗那,第18-22页。
[5] DOI:10.1016/j.robot.2006.01.008·doi:10.1016/j.robot.2006.01.008
[6] 内政部:10.1080/08839510701252619·doi:10.1080/08839510701252619
[7] DOI:10.1109/TEVC.2004.831456·doi:10.1109/TEVC.2004.831456
[8] Gholipour,A.、Lucas,C.和Shahmirzadi,D.(2004),“通过模拟情感学习对空间天气现象进行有目的的预测”,IASTED国际建模与仿真杂志,第24卷,第65-72页·doi:10.2316/期刊.205.2004.2.205-4121
[9] DOI:10.115/1.3153817·Zbl 0452.58020号 ·数字对象标识代码:10.1115/1.3153817
[10] Jafarzadeh,S.、Jahed Motlagh,M.R.、Barkhordari,M.和Mirheidari,R.(2008),“基于Lyapunov的新算法,用于调整一组线性系统的BELBIC控制器”,《第十六届地中海控制与自动化会议论文集》,法国阿雅克肖,第593-5页·doi:10.1109/MED.2008.4602180
[11] DOI:10.1016/j.eswa.2008.09.067·doi:10.1016/j.eswa.2008.09.067
[12] Jamali,M.R.、Pedram,A.、Milasi,M.R和Lucas,C.(2006),“BELBIC模式的设计和实施”,《第十四届伊朗电气工程会议论文集》,伊朗德黑兰,第436-41页。
[13] Jamali,M.R.、Arami,A.、Hosseini,B.、Moshiri,B.和Lucas,C.(2008年),“SIMO桥式起重机防摆和定位控制的实时情感控制”,《国际创新计算、信息与控制杂志》,第4卷,第2333-44页。
[14] 内政部:10.1109/TCSI.2002.805712·Zbl 1368.93251号 ·doi:10.10109/TCSI.2002.805712
[15] Jin,Y.和Sendhoff,B.(2008),“基于Pareto的多目标机器学习:概述和案例研究”,IEEE Trans。《系统人与控制论——C部分:应用与评论》,第38卷,第397-415页·doi:10.1109/TSMCC.2008.919172
[16] 内政部:10.1109/70.338535·数字对象标识代码:10.1109/70.338535
[17] Latzke,T.、Behenke,S.和Bennewitz,M.(2006),“足球机器人的模拟强化学习”,第十届机器人杯国际研讨会论文集,德国不来梅,第47-58页。
[18] 内政部:10.1109/TSMCB.2005.846654·doi:10.1109/TSMCB.2005.846654
[19] 内政部:10.1080/10798587.2004.10642862·doi:10.1080/10798587.2004.10642862
[20] Milasi,R.M.、Jamali,M.R.和Lucas,C.(2007),“智能洗衣机:生物启发和多目标方法”,《国际控制、自动化和系统杂志》,第5卷,第436-43页。
[21] Milasi,R.M.、Lucas,C.和Araabi,B.N.(2004),“使用BELBIC(基于大脑情感学习的智能控制器)的内部永磁同步电机的速度控制”,《第五届智能自动化和控制国际研讨会论文集》,世界自动化大会,西班牙塞维利亚,第16卷,第280-6页。
[22] Milasi,R.M.、Lucas,C.和Araabi,B.N.(2006a),“使用局部线性神经模糊(LLNF)建模和基于改进大脑情感学习的智能控制器(BELBIC)对洗衣机进行智能建模和控制”,《亚洲控制杂志》,第8卷,第393-400页。
[23] Milasi,R.M.、Lucas,C.、Araabi,B.N.、Radwan,T.S.和Rahman,M.A.(2006b),“内部永磁同步电机驱动情感控制器的实现”,IEEE/IAS第41届年会会议记录:工业应用,美国佛罗里达州坦帕,第4卷,第1767-74页·doi:10.1109/IAS.2006.256774
[24] DOI:10.1080/08839510601170713·网址:10.1080/08839510601170713
[25] 内政部:10.1109/TRO.2007.914848·doi:10.1109/TRO.2007.914848
[26] Shahmirzadi,D.和Langari,R.(2005),“使用细胞到细胞映射算法的杏仁核学习系统稳定性”,《智能系统与控制杂志》,第4卷,第97-119页。
[27] Shahmirzadi,D.、Lucas,C.和Langari,R.(2003),“使用BEL的智能信号融合算法-大脑情感学习”,第七届信息科学联合会议论文集,JCIS’03,第一届类大脑计算机体系结构研讨会,美国北卡罗来纳州卡里市。
[28] Sharbafi,M.A.,Lucas,C.,Mohammadinejad,A.和Yaghobi,M.(2006),“设计一支由机器人组成的足球队”,《国际信息技术杂志》,第3卷第2期,第101-8页。
[29] Sheikholeslami,N.、Shahmirzadi,D.、Semsar,E.、Lucas,C.和Yazdanpanah,M.J.(2006),“将大脑情感学习算法应用于暖通空调系统的多变量控制”,《智能与模糊系统国际期刊》,第17卷,第35-46页。
[30] Takagi,T.和Sugeno,M.(1983年),“从人类操作员的控制行为中导出模糊控制规则”,IFAC模糊信息、知识表示和决策分析研讨会论文集,法国马赛,第55-60页。
[31] Tong,S.和Li,Y.(2007),“一类非线性系统的直接自适应模糊反推控制”,《国际创新计算、信息与控制杂志》,第3卷,第877-96页。
[32] 内政部:10.1142/S0218213007003205·doi:10.1142/S0218213007003205
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。