×

多智能体团队合作:一种博弈论方法。 (英语) Zbl 1179.93025号

总结:这项工作的主要目标是设计一个代理团队,该团队能够使用合作博弈论方法就代理输出的共同价值达成共识。采用了作者最近提出的一种基于局部信息最小化个体成本的半分散最优控制策略。然后,利用合作博弈理论,将个人成本组合作为团队成本函数,以确保团队合作。此成本函数的最小化会产生一组帕累托效率解决方案。在帕累托有效解中,选择纳什讨价还价解。纳什均衡解是通过使通过最优控制策略获得的成本与通过帕累托有效解获得的成本之差的乘积最大化而获得的。后一种解决方案以需要完整信息集为代价,降低了每个代理的成本。为了避免这个缺点,使用最小化问题的线性矩阵不等式(LMI)公式,为整个团队建议的控制器结构添加了一些约束。因此,尽管控制器的设计是为了最小化唯一的团队成本函数,但它只使用每个代理的可用信息集。对使用上述两种方法获得的平均成本进行了比较,以说明我们提出的解决方案的性能能力。

MSC公司:

93甲14 分散的系统
91A12号机组 合作游戏
93立方厘米 由常微分方程控制的控制/观测系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾特·拉米,M。;Zhou,X.Y.,线性矩阵不等式、Riccati方程和不定随机线性二次控制,IEEE自动控制汇刊,45,61111-1142(2000)·Zbl 0981.93080号
[2] 安德森,B.D.O。;Moore,J.B.,(最优控制:线性二次方法。最优控制:线形二次方法,普伦蒂斯·霍尔信息与系统科学系列(1990))·Zbl 0751.49013号
[3] Arcak,M.(2006)。被动性作为团队协调的设计工具。程序。美国控制会议; Arcak,M.(2006)。被动性作为团队协调的设计工具。程序。美国控制会议
[4] Bauso,D.、Giarre,L.和Pesenti,R.(2006)。最优共识问题的机制设计。程序。决策和控制会议; Bauso,D.、Giarre,L.和Pesenti,R.(2006)。最优共识问题的机制设计。程序。决策和控制会议·Zbl 1111.68009号
[5] Bošković,J.D.,Li,S.M.,&Mehra,R.K.(2002)。未知领队指令下的编队飞行控制设计。在:程序。美国控制会议; Bošković,J.D.,Li,S.M.,&Mehra,R.K.(2002)。未知领队指令下的编队飞行控制设计。在:程序。美国控制会议
[6] 博伊德,S。;加维,L.E。;Feron,E。;Balakrishnan,V.,系统和控制理论中的线性矩阵不等式(1994),SIAM·Zbl 0816.93004号
[7] Engwerda,J.C.,LQ动态优化和微分对策(2005),John Wiley&Sons
[8] 传真:J.A.(2002)。车辆编队的最优协同控制。博士论文; 传真:J.A.(2002)。车辆编队的最优协同控制。博士论文
[9] 传真:J.A。;Murray,R.M.,车辆编队的信息流和协同控制,IEEE自动控制汇刊,49,9,1465-1476(2004)·Zbl 1365.90056号
[10] Gazi,V.(2002)。蜂群的稳定性分析。博士论文; Gazi,V.(2002)。蜂群稳定性分析。博士论文·兹比尔1365.92143
[11] Godsil,C。;Royle,G.,代数图论(2001),Springer·Zbl 0968.05002号
[12] Inalhan,G.、Stipanović,D.M.和Tomlin,C.J.(2002年)。分散优化,应用于多架飞机协调。程序。决策和控制会议; Inalhan,G.、Stipanović,D.M.和Tomlin,C.J.(2002年)。分散优化,应用于多架飞机协调。程序。决策和控制会议
[13] Jadbabaie,A.(1997年)。使用基于模型的模糊系统的鲁棒、非脆弱控制器综合:线性矩阵不等式方法。硕士论文; Jadbabaie,A.(1997年)。使用基于模型的模糊系统的鲁棒、非脆弱控制器综合:线性矩阵不等式方法。硕士论文
[14] Jadbabaie,A。;林,J。;Morse,S.,使用最近邻规则协调移动自治代理组,IEEE自动控制事务,48,6988-1000(2003)·Zbl 1364.93514号
[15] Lee,D.和Spong,M.W.(2006年)。同意非一致信息延迟。程序。美国控制会议; Lee,D.和Spong,M.W.(2006年)。同意非一致信息延迟。程序。美国控制会议
[16] Olfati Saber,R.,多智能体动态系统的植绒:算法和理论,IEEE自动控制汇刊,51,3401-420(2006)·Zbl 1366.93391号
[17] Olfati-Saber,R.和Murray,R.M.(2002)。动态多智能体编队的分布式结构稳定与跟踪。在:程序。决策和控制会议; Olfati-Saber,R.和Murray,R.M.(2002)。动态多智能体编队的分布式结构稳定与跟踪。在:程序。决策和控制会议
[18] Olfati-Saber,R.和Murray,R.M.(2003年a)。具有有向图和交换拓扑的网络中的协议问题。程序。决策和控制会议; Olfati-Saber,R.和Murray,R.M.(2003年a)。具有有向图和交换拓扑的网络中的协议问题。程序。决策与控制会议
[19] Olfati-Saber,R.和Murray,R.M.(2003b)。动态代理网络的共识协议。在:程序。美国控制会议; Olfati-Saber,R.和Murray,R.M.(2003b)。动态代理网络的共识协议。在:程序。美国控制会议
[20] Olfati-Saber,R.和Murray,R.M.(2003c)。群集与避障:在移动网络中与有限的通信进行合作。程序。决策和控制会议; Olfati-Saber,R.和Murray,R.M.(2003c)。群集与避障:在移动网络中与有限的通信进行合作。程序。决策和控制会议
[21] Olfati-Saber,R。;Murray,R.M.,具有切换拓扑和延迟的代理网络中的共识问题,IEEE自动控制汇刊,49,9,1520-1533(2004)·Zbl 1365.93301号
[22] Paley,D.、Leonard,N.E.和Sepulchre,R.(2004)。集体运动:双稳态和轨迹跟踪。程序。决策和控制会议; Paley,D.、Leonard,N.E.和Sepulchre,R.(2004)。集体运动:双稳态和轨迹跟踪。程序。决策和控制会议
[23] Raffard,R.L.、Tomlin,C.J.和Boyd,S.P.(2004)。合作代理的分布式优化:在编队飞行中的应用。程序。决策和控制会议; Raffard,R.L.、Tomlin,C.J.和Boyd,S.P.(2004年)。合作代理的分布式优化:在编队飞行中的应用。程序。决策和控制会议
[24] Ren,W.(2007)。关于双积分动力学的一致性算法。程序。决策和控制会议; Ren,W.(2007)。关于双积分动力学的一致性算法。程序。决策和控制会议
[25] Ren,W。;Beard,R.W.,通过虚拟结构实现多航天器编队反馈控制,IEE程序控制理论与应用,151,3,357-368(2004)
[26] Ren,W。;Beard,R.W.,动态变化交互拓扑下多智能体系统中的共识寻求,IEEE自动控制事务,50,5,655-661(2005)·Zbl 1365.93302号
[27] Semsar,E.和Khorasani,K.(2006年)。无人机在存在未知涡流力和引导指令的情况下的自适应编队控制。程序。美国控制会议; Semsar,E.和Khorasani,K.(2006年)。无人机在存在未知涡流力和引导指令的情况下的自适应编队控制。程序。美国控制会议
[28] Semsar,E.和Khorasani,K.(2007年)。多车辆无人系统团队合作控制的最优控制和博弈论方法。程序。IEEE网络、传感和控制国际会议; Semsar,E.和Khorasani,K.(2007年)。多车辆无人系统团队合作控制的最优控制和博弈论方法。程序。IEEE网络、传感和控制国际会议
[29] Semsar-Kazerooni,E.和Khorasani,K.(2007a)。在部分可用领导命令的情况下,改进的领导-跟随代理团队中的最佳合作。程序。IEEE系统、人与控制论国际会议; Semsar-Kazerooni,E.和Khorasani,K.(2007a)。在部分可用领导命令的情况下,改进的领导-跟随代理团队中的最佳合作。程序。IEEE系统、人与控制论国际会议
[30] Semsar-Kazerooni,E.和Khorasani,K.(2007b)。合作代理团队的半分散最优控制。程序。IEEE系统工程体系国际会议; Semsar-Kazerooni,E.和Khorasani,K.(2007b)。合作代理团队的半分散最优控制。程序。IEEE系统工程体系国际会议·兹比尔1194.49056
[31] Semsar-Kazerooni,E.和Khorasani,K.(2007c)。具有部分领导者命令可用性的无人系统领导者-追随者团队的半分散最优控制技术。程序。IEEE控制与自动化国际会议; Semsar-Kazerooni,E.和Khorasani,K.(2007c)。领导-跟随无人系统团队的半分散最优控制技术,领导者命令部分可用。程序。IEEE控制与自动化国际会议
[32] Semsar-Kazerooni,E。;Khorasani,K.,《受部分信息约束的代理合作团队的最优共识算法》,Automatica,44,11,2766-2777(2008)·Zbl 1194.49056号
[33] Semsar-Kazerooni,E。;Khorasani,K.,《受部分信息约束的代理团队中的最佳合作》,《国际控制杂志》,82,3,571-583(2009)·Zbl 1168.93309号
[34] Sinopoli,B。;夏普,C。;Schenato,L.公司。;沙弗西姆,S。;Sastry,S.,传感器网络中的分布式控制应用,IEEE会议录,91,8,1235-1246(2003)
[35] Stipanović,医学博士。;Inalhan,G。;特奥·R。;Tomlin,C.J.,《无人机编队的分散重叠控制》,Automatica,401285-1296(2004)·Zbl 1073.93556号
[36] Tanner,H.G。;Jadbabaie,A。;Pappas,G.J.,固定和交换网络中的植绒,IEEE自动控制汇刊,52,5,863-868(2007)·Zbl 1366.93414号
[37] Willems,J.C.,最小二乘平稳最优控制和代数Riccati方程,IEEE自动控制汇刊,16,6,621-634(1971)
[38] 肖,F。;Wang,L.,高维多智能体系统的共识问题,IET控制理论应用,1,3,830-837(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。