×

(N)联盟非合作博弈的动态广义纳什均衡求解。 (英语) Zbl 1505.91028号

摘要:本文研究了由双积分智能体参与的(N)联盟非合作博弈的纳什均衡寻求问题,其中设计了反馈控制器以引导物理过程达到广义纳什均衡(GNE)。每个联盟都可以被视为一个N人游戏中的虚拟玩家,该游戏试图最小化其成本函数,而行动是由联盟的代理集体进行的。在博弈中,每个联盟中的代理都受到局部集约束和耦合非线性约束。为了处理动力系统中的局部集约束,设计了一个障碍函数,并证明了其凸性和可微性。通过调整原代价函数,构造了一个新的博弈,证明了该博弈的解是原博弈的(varepsilon)-GNE,解的误差可以任意小。为了求解适应的N联盟非合作博弈,设计了一种利用一致性和原-对偶梯度动力学的分布式算法。利用微分包含的稳定性理论,建立了变分GNE的收敛性。同时,可以沿整个轨迹满足局部集约束。对两个竞争的移动传感器网络进行了数值仿真,验证了该算法的有效性。

MSC公司:

91A11号机组 平衡优化
91年10月 非合作游戏
93B52号 反馈控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aubin,J。;Cellina,A.,《差异包裹体》(1984),施普林格-弗拉格:德国柏林施普林格·兹比尔0538.34007
[2] Belgiioso,G.和Grammatico,S.(2018年)。聚合对策中广义均衡寻求的投影梯度算法是一种预条件的前向-后向方法。2018年欧洲控制会议(ECC)(第2188-2193页)。
[3] Bianchi,M。;Grammatico,S.,多积分器代理的连续时间全分布广义Nash均衡寻求,Automatica,129,第109660条pp.(2021)·Zbl 1478.93615号
[4] 陈,G。;Ming,Y。;Y.Hong。;Yi,P.,带不确定耦合约束的(ε)广义Nash均衡的分布式算法,Automatica,123,文章109313 pp.(2021)·Zbl 1460.91013号
[5] Cherukuri,A。;Mallada,E。;Cortés,J.,约束原对偶动力学的渐近收敛,《系统与控制快报》,87,10-15(2016)·兹比尔1327.49057
[6] 孔特雷拉斯,J。;Klusch,M。;Krawczyk,J.,耦合约束电力市场中Nash-Cournot均衡的数值解,IEEE电力系统交易,19,1,195-206(2004)
[7] 法奇尼,F。;Kanzow,C.,广义Nash均衡问题,运筹学年鉴,175,1,177-211(2010)·Zbl 1185.91016号
[8] 加乔夫,D。;Pavel,L.,基于被动性的网络纳什均衡寻求方法,IEEE自动控制汇刊,64,3,1077-1092(2019)·Zbl 1482.91047号
[9] Gharisfard,B。;Cortés,J.,双网络零和博弈中Nash均衡的分布式收敛,Automatica,49,6,1683-1692(2013)·Zbl 1360.91012号
[10] Grammatico,S.,《使用耦合约束进行聚合游戏的代理的动态控制》,IEEE自动控制汇刊,62,9,4537-4548(2017)·Zbl 1390.91063号
[11] 郭,M。;De Persis,C.,《动态参与者的线性二次网络博弈:稳定和输出收敛到纳什均衡》,Automatica,130,第109711页,(2021)·Zbl 1478.91037号
[12] 吉提什,J。;Sankaran,S.,《应用于多回路无人机控制的确保网络物理系统可信度的游戏理论方法》,《新兴电信技术交易》,32,5,1-35(2021)
[13] Khalil,H.,非线性系统(2002),普伦蒂斯·霍尔:新泽西州普伦蒂斯霍尔上鞍河·Zbl 1003.34002号
[14] Krilasevic,S。;Grammatico,S.,通过极值寻求控制学习多智能体动力学系统中的广义Nash均衡,Automatica,133,第109846页,(2021)·Zbl 1480.93021号
[15] 库尔卡尼,A。;Shanbhag,U.,《关于变分均衡作为广义Nash均衡的细化》,Automatica,48,1,45-55(2012)·Zbl 1245.91006号
[16] 刘,Q。;Yang,S。;Wang,J.,分布式约束优化的集体神经动力学方法,IEEE神经网络和学习系统汇刊,28,8,1747-1758(2017)
[17] Lou,Y。;Y.Hong。;谢林。;Shi,G。;Johansson,K.H.,具有交换通信的子网零和博弈中的纳什均衡计算,IEEE自动控制汇刊,61,10,2920-2935(2016)·兹比尔1359.91022
[18] Menon,A.和Baras,J.(2014)。寻求福利优化的合作极端。第53届IEEE决策与控制会议(CDC)(第346-351页)。
[19] 纳格尼,A。;Zhang,D.,投影动力系统和变分不等式及其应用(1996),Kluwer学术:阿姆斯特丹Kluwer-学术
[20] 年,X。;牛,F。;Yang,Z.,在交换通信拓扑下寻求多集群博弈的分布式纳什均衡,IEEE系统、人和控制论事务:系统(2021)
[21] Paccagnan,D.、Gentile,B.、Parise,F.、Kamgerpour,M.和Lygeros,J.(2016)。具有仿射耦合约束的二次聚集对策中广义纳什均衡的分布式计算。第55届IEEE决策与控制会议(CDC)(第6123-6128页)·Zbl 1482.91045号
[22] Pavel,L.,通过双重增广算子分裂方法在网络上寻求部分决策信息的分布式GNE,IEEE自动控制事务,65,4,1584-1597(2020)·Zbl 1533.91017号
[23] R.,Rockafellar(1970年)。与鞍函数和极大极小问题相关的单调算子。《纯粹数学专题讨论会论文集》(第241-250页)·Zbl 0237.47030号
[24] A.罗曼诺。;Pavel,L.,《动态NE寻求具有干扰抑制功能的多积分器网络代理》,IEEE网络系统控制事务,7,1,129-139(2020)·Zbl 1516.93016号
[25] Romano,A.和Pavel,L.(2020b)。GNE在带有被动动态代理的游戏中通过不精确的犯罪方法进行搜索。第59届IEEE决策与控制会议(CDC)(第500-505页)。
[26] A.罗曼诺。;Pavel,L.,《使用动态代理进行游戏中GNE搜索的一种不精确犯罪方法》(2021),arXiv-eprints arXiv:2104.11609
[27] 斯坦科维奇,M。;约翰逊,K。;Stipanovic,D.,移动传感器网络应用的纳什均衡分布式搜索,IEEE自动控制汇刊,57,4,904-919(2012)·Zbl 1369.91031号
[28] Sun,C。;Hu,G.,利用正则惩罚动力系统寻求单调广义非合作对策的分布式广义Nash均衡,IEEE控制论汇刊,51,11,5532-5545(2021)
[29] 瑟斯顿,W.,《三维几何与拓扑》,第1卷(1997),普林斯顿大学出版社:普林斯顿大学出版·Zbl 0873.57001号
[30] Ye,M。;胡,G。;Lewis,F.,寻求联盟非合作博弈的Nash均衡,Automatica,95,266-272(2018)·Zbl 1417.91031号
[31] Ye,M。;胡,G。;Xu,S.,基于极值搜索的非合作博弈纳什均衡求解方法,Automatica,114,第108815页,(2020)·兹比尔1441.91005
[32] Yi,P。;Pavel,L.,分布式广义Nash均衡计算的算子分裂方法,Automatica,102111-121(2019)·Zbl 1411.91031号
[33] 袁,D。;Ho,D。;Xu,S.,分布式约束优化的正则化原对偶次梯度方法,IEEE控制论汇刊,46,9,2109-2118(2016)
[34] 曾,X。;陈,J。;Liang,S。;Hong,Y.,分布式非光滑多集群博弈的广义Nash均衡寻求策略,Automatica,103,20-26(2019)·Zbl 1411.91032号
[35] Zhang,Y。;Liang,S。;王,X。;Ji,H.,在外部干扰下寻求非线性动力学聚合博弈的分布式纳什均衡,IEEE控制论汇刊,50,12,4876-4885(2020)
[36] 朱,M。;Martinez,S.,能源感知移动传感器网络的分布式覆盖游戏,SIAM控制与优化杂志,51,1,1-27(2013)·Zbl 1262.68183号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。