×

具有切换拓扑的非线性多智能体系统的高精度编队控制:一种学习方法。 (英语) Zbl 1328.93026号

摘要:对于许多网络化工业应用,如飞行器和移动机器人,任意高精度被认为是相对编队最理想的控制目标之一。本文的主要目的是提出应用迭代方案开发分布式编队算法的设计准则,以实现此控制目标。如果满足某些条件,则可以通过所开发的算法学习控制输入信号,以实现任意高精度的所需编队。所考虑的系统是具有交换拓扑的有向网络下的一类多智能体系统。这些代理具有离散仿射非线性动力学,但它们的状态函数不必相同。结果表明,由多智能体系统相对输出形式产生的学习过程可以随着迭代次数的增加以指数形式快速收敛。特别是,这项工作引入了一种分布式算法,该算法可以同时实现代理之间所需的相对输出编队,并根据需要沿时间轴调整多代理编队的移动。最后通过数值仿真验证了所提分布式编队算法的有效性和性能。

MSC公司:

93甲14 分散的系统
68T42型 Agent技术与人工智能
68T05型 人工智能中的学习和自适应系统
93二氧化碳 控制理论中的线性系统
93立方 由微分方程以外的函数关系控制的控制/观测系统(例如混合系统和开关系统)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] CaoY、YuW、RenW、ChengG。分布式多智能体协调研究的最新进展综述。2013年IEEE工业信息汇刊;9(1):427-438.
[2] YangG、YangQ、KapilaV、PalmerD、VaidyanathanR。使用多智能体优化的多航天器编队重构燃料优化机动。国际鲁棒与非线性控制杂志2002;12(2‐3):243-283. ·Zbl 1098.49507号
[3] 霍顿M、福克纳W、汉森J、赫鲁比V。ST7‐DRS:朝着无阻力和高精度编队控制迈出的一步。IEEE航空航天会议:空间技术验证任务,2004年,美国密歇根州大天空。可从以下位置获得:http://ntrs.nasa.gov/search.jsp?R=20040012862。2004年3月6日至13日。
[4] 卡尔松A·基尔特。欧洲高精度编队飞行干涉仪达尔文的微推进技术。第四届国际航天器推进会议记录,卡利亚里,撒丁岛,意大利,2004年;1-6. 可从以下位置获得:http://adsabs.harvard.edu//abs/2004ESASP.555E..85K。2004年6月2日至9日。
[5] 缅因州达根特。空间磁驱动器及其在高精度编队飞行中的应用。阿尔卡特航天工业报告-戛纳-拉博卡,2005年;1-10. (可从以下网址获得:http://oai.dtic.mil/oai/oai?动词=getRecord&metadataPrefix=html&identifier=ADA445193。)[2005年7月13日查阅。]
[6] AhnHS、MooreKL、ChenY。轨道——通过鲁棒的周期学习控制保持卫星编队飞行的轨迹。国际鲁棒与非线性控制杂志2010;20(14):1655-1666. ·Zbl 1204.93082号
[7] LewisMA,TanKH。基于虚拟结构的移动机器人高精度队形控制。自治机器人1997;4(4):387-403.
[8] KhooS、XieL、ManZ。多机器人系统的鲁棒有限时间一致性跟踪算法。IEEE/ASME机电汇刊2009;14(2):219-228。
[9] ChenX、JiaY。使用迭代学习的基于立体视觉的移动机器人编队控制。《国际人性化系统会议记录》,日本京都,2010年;62-67.
[10] OuM、DuH、LiS。多个非完整移动机器人的有限时间编队控制。国际鲁棒与非线性控制杂志2014;24(1):140-165. ·兹比尔1278.93173
[11] 德斯穆赫·利安兹。无人机载飞行器多智能体系统的性能预测。欧洲运筹学杂志2006;172(2):680-695. ·Zbl 1168.90669号
[12] OrquedaOAA、ZhangXT、FierroR。一种用于无人机协调的输出反馈非线性分散控制器。国际鲁棒与非线性控制杂志2007;17(12):1106-1128. ·Zbl 1266.93008号
[13] AlighanbariM,HowJP。无人机任务分配问题的稳健方法。国际鲁棒与非线性控制杂志2008;18(2):118-134. ·Zbl 1282.93185号
[14] 拉斯穆森SJ,ShimaT。用于将协作无人机分配给多个任务的树搜索算法。国际鲁棒与非线性控制杂志2008;18(2):135-153. ·Zbl 1282.93190号
[15] RenW,BeardRW。动态变化交互拓扑下多智能体系统中的共识寻求。IEEE自动控制汇刊2005;50(5):655-661. ·Zbl 1365.93302号
[16] LiZ、DuanZ、ChenG、HuangL。多智能体系统的一致性和复杂网络的同步:一个统一的观点。IEEE电路与系统汇刊I:常规论文2010;57(1):213-224·Zbl 1468.93137号
[17] 刘易斯·陈。具有耦合延迟和可变拓扑的多惯性代理的鲁棒一致性。2011年《国际鲁棒和非线性控制杂志》;21(6):666-685. ·Zbl 1213.93009号
[18] YangT,RoyS,WanY,SaberiA.为具有相同一般线性代理的网络构造一致控制器。2011年《国际鲁棒和非线性控制杂志》;21(11):1237-1256. ·Zbl 1244.93015号
[19] LiS、DuH、LinX。具有双积分器动力学的多智能体系统的有限时间一致性算法。自动化2011;47(8):1706-1712. ·Zbl 1226.93014号
[20] YangH、ZhangZ、Zhang S。具有外部扰动的二阶多智能体系统的一致性。2011年《国际鲁棒和非线性控制杂志》;21(9):945-956. ·Zbl 1215.93014号
[21] 秦杰、高赫、郑伟新。一类具有离散二阶动力学的多智能体的一致性策略。国际鲁棒与非线性控制杂志2012;22(4):437-452. ·Zbl 1261.93007号
[22] 孟德、贾谊、杜杰、余芳。具有时变参考轨迹的多智能体系统在有限区间上的跟踪控制。系统和控制信函2012;61(7):807-818. ·Zbl 1250.93013号
[23] Xiong W、HoDWC、CaoJ。具有非线性扰动的多智能体定向网络的脉冲一致性。国际鲁棒与非线性控制杂志2012;22(14):1571-1582. ·Zbl 1274.93012号
[24] 刘克、谢格、王莉。具有时变通信延迟的双积分器动态下多智能体系统的共识。国际鲁棒与非线性控制杂志2012;22(17):1881-1898. ·兹比尔1263.93009
[25] ShiG,JohanssonKH。多智能体系统的随机最优共识。自动化2012;48(12):3018-3030. ·Zbl 1256.93012号
[26] ZouAM、KumarKD、HouZG。基于终端滑模和切比雪夫神经网络的多智能体系统分布式一致性控制。国际鲁棒与非线性控制杂志2013;23(3):334-357. ·Zbl 1273.93015号
[27] YangT,JinY。三维空间中无相对速度测量的多智能体旋转共识。国际鲁棒与非线性控制杂志2013;23(5):473-482. ·Zbl 1284.93024号
[28] 陈安华(AhnHS)。多智能体形成的迭代学习控制。ICROS‐SICE国际联合会议记录,日本福冈,2009年;3111-3116.
[29] FidanB、HendrickxJM、Anderson BDO。使用边缘收缩在刚性多智能体编队中完成排名。国际鲁棒与非线性控制杂志2010;20(18):2077-2092. ·Zbl 1207.93003号
[30] XuJX、Zhang S、Yang S。一种基于HOIM的多智能体编队迭代学习控制方案。IEEE智能控制国际研讨会,丹佛,科罗拉多州,美国;418-423.
[31] 刘毅、佳毅。多智能体系统编队控制的迭代学习方法。系统和控制信函2012;61(1):148-154. ·Zbl 1250.93011号
[32] 刘毅、佳毅。采用迭代学习方法对离散时间多智能体系统进行编队控制。国际控制、自动化与系统杂志2012;10(5):913-919.
[33] Huang H、YuC、WuQ。只有形状约束的多智能体编队的自主规模控制。2013年《国际鲁棒和非线性控制杂志》;23(7):765-791. ·Zbl 1273.93006号
[34] 孟德、贾谊。通过迭代学习设计方法实现多智能体系统的编队控制。国际鲁棒与非线性控制杂志2014;24(2):340-361. ·Zbl 1279.93010号
[35] Olfati‐SaberR。多智能体动态系统的集群:算法和理论。IEEE自动控制汇刊2006;51(3):401-420. ·Zbl 1366.93391号
[36] 翁,段Z,李Z,陈G。具有间歇性非线性速度测量的多智能体动力学系统的群集。国际鲁棒与非线性控制杂志2012;22(16):1790-1805. ·Zbl 1273.93011号
[37] 东江。在等级领导下与自由意志的领导者并肩作战。国际鲁棒与非线性控制杂志2013;23(16):1891-1898. ·Zbl 1285.93006号
[38] 罗阿、徐克斯、方乐、方赫、吴杰、吴C。带注入电路的混合型有源电力滤波器的反馈前馈PI型迭代学习控制策略。IEEE工业电子学报2010;57(11):3767-3779.
[39] LiuJ、ZanchettaP、DeganoM、LavopaE。飞机电网中高性能并联有源滤波器的控制设计与实现。IEEE工业电子学报2012;59(9):3604-3613.
[40] SaabSS。在存在测量噪声的情况下,选择迭代学习控制算法的学习增益矩阵。IEEE自动控制汇刊2005;50(11):1761-1774. ·Zbl 1365.93554号
[41] 布里斯托DA、塔拉伊尔M、阿连尼AG。迭代学习控制综述:一种基于学习的高性能跟踪控制方法。IEEE控制系统杂志2006;26(3):96-114。
[42] AhnHS、ChenY、MooreKL。迭代学习控制:简要调查和分类。IEEE系统、人与控制论汇刊——第C部分:应用与评论2007;37(6):1099-1121.
[43] 徐家X。非线性系统迭代学习控制综述。国际控制杂志2011;84(7):1275-1294. ·兹比尔1227.93053
[44] 扎雷姆巴姆·库雷克杰。基于2-D系统理论的迭代学习控制综合。1993年IEEE自动控制汇刊;38(1):121-125. ·Zbl 0773.93019号
[45] LiXD、ChowTWS、HoJKL。基于2-D系统理论的线性连续时滞系统迭代学习控制。IEEE电路与系统汇刊-I:2005年常规论文;52(7):1421-1430. ·Zbl 1374.93177号
[46] 孟德、嘉义、杜杰、袁斯。具有不同初始状态转移的非线性系统的鲁棒离散时间迭代学习控制。IEEE自动控制汇刊2009;54(11):2626-2631. ·Zbl 1367.93739号
[47] 孟德、贾谊、杜杰、余芳。通过迭代学习实现相对学位系统的数据驱动控制。IEEE神经网络汇刊2011;22(12):2213-2225.
[48] KhalilHK公司。非线性系统。《学徒堂:上马鞍河》,新泽西州,2002年·Zbl 1003.34002号
[49] HornRA,JohnsonCR。矩阵分析。剑桥大学出版社:剑桥,1985年·Zbl 0576.15001号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。