×

反协调网络游戏动力学的平衡分析和基于激励的控制。 (英语) Zbl 1505.91089号

摘要:如何预测和控制网络人口中的集体决策动态对于工程、社会和自然科学的各种应用具有重要意义,并吸引了跨网络系统和控制理论的新兴交叉学科研究。本文研究了反协调代理网络中的异步最佳响应动力学。为了识别阈值对反协调模型的影响,我们考虑了齐次阈值网络,并探讨了阈值如何影响收敛时间和网络平衡。收敛时间的结果表明,策略交换机总数的上限由三个因素决定:网络边缘数、网络节点数和网络阈值。基于Lyapunov方法,对网络平衡点进行了渐近稳定性分析。同时,通过在博弈过程中引入相关的报酬激励(即奖励或惩罚),可以在有限的时间内实现与不同策略的相邻代理的最大反协调均衡,从而获得更稳定的系统范围的结果。

MSC公司:

91A22型 进化游戏
91A43型 涉及图形的游戏
93D20型 控制理论中的渐近稳定性
93B70型 网络控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德烈奥尼,J。;Harbaugh,W。;Vesterlund,L.,《胡萝卜还是大棒:奖励、惩罚、合作》,《美国经济评论》,93,3,893-902(2003)
[2] Arditti,L.、Como,G.、Fagnani,F.和Vanelli,M.(2021)。混合网络协调/反协调游戏中的均衡和学习动力学。IEEE决策和控制会议(第4982-4987页)。
[3] 巴雷罗·戈麦斯,J。;奥班多,G。;Quijano,N.,《分布式人口动态:优化和控制应用》,IEEE系统、人与控制论汇刊:系统,47,2,304-314(2017)
[4] 巴雷罗·戈麦斯,J。;奥坎波·马丁内斯,C。;Quijano,N.,《使用人口游戏对MPC进行动态调整:供水网络应用程序》,ISA Transactions,69,175-186(2017)
[5] Barthélemy,M。;Barrat,A。;Pastor-Satorras,R。;Vespignani,A.,复杂异质网络中疫情爆发的动态模式,理论生物学杂志,235,2,275-288(2005)·Zbl 1445.92262号
[6] Bauso,D。;Cannon,M.,《作为重复游戏的舆论动态共识》,Automatica,90,204-211(2018)·Zbl 1387.93008号
[7] 贝瑟斯,S.N。;Fewell,J.H.,《群居昆虫分工模型》,《昆虫学年度评论》,46,1,413-440(2001)
[8] Bopardikar,S.D。;Speranzon,A。;Langbort,C.,可信计算游戏迭代最佳响应的收敛分析,Automatica,78,88-96(2017)·兹比尔1357.93064
[9] 陈,G。;Li,Z.,多智能体系统中分布式凸优化的固定时间收敛算法,Automatica,95539-543(2018)·Zbl 1402.93023号
[10] 陈,G。;Li,Z.,强连通有向图上的分布式最优资源分配:基于盈余的方法,Automatica,125,第109459页,(2021)·Zbl 1461.93181号
[11] Choi,H.-L。;布鲁内特,L。;How,J.P.,《基于共识的分散式拍卖用于稳健任务分配》,IEEE机器人交易,25,4,912-926(2009)
[12] 埃克辛,C。;Paarporn,K.,《反协调网络游戏中的学习控制》,IEEE网络系统控制事务,7,4,1823-1835(2020)·Zbl 07583248号
[13] 埃克辛,C。;Shamma,J.S。;Weitz,J.S.,《随机网络游戏中的疾病动力学:一点同理心对避免疫情大有帮助》,《科学报告》,第744122页(2017年)
[14] Fontan,A。;Altafini,C.,一类集体决策网络系统的多重均衡分析,IEEE网络系统控制事务,5,4,1931-1940(2018)·Zbl 1515.93079号
[15] Grabisch,M。;Li,F.,集体行为阈值模型中的反合规,动态博弈与应用,10444-477(2020)·Zbl 1437.91345号
[16] Grammatico,S.,《使用耦合约束进行聚合游戏的代理的动态控制》,IEEE自动控制汇刊,62,9,4537-4548(2017)·Zbl 1390.91063号
[17] Granovetter,M.,《集体行为的阈值模型》,《美国社会学杂志》,83,6,1420-1443(1978)
[18] Le,H。;Ramazi,P.,《最佳反应者和模仿者的异质混合种群:平衡收敛和稳定性》,IEEE自动控制汇刊,66,8,3475-3488(2021)·Zbl 1471.91110号
[19] 利伯曼,E。;Hauert,C。;Nowak,M.A.,《图的进化动力学》,《自然》,433312-316(2005)
[20] 林,X。;焦,Q。;Wang,L.,《签约社交网络中的竞争扩散:游戏理论视角》,Automatica,112,第108656页(2020)·Zbl 1430.91068号
[21] Marden,J.R。;Roughgarden,T.,分布式资源分配的广义效率界限,IEEE自动控制事务,59,3,571-584(2014)·Zbl 1360.91100号
[22] Marden,J.R。;Shamma,J.S.,《博弈论与控制》,《控制、机器人与自治系统年度回顾》,第1期,第105-134页(2018年)
[23] Mäs,M。;Nax,H.H.,协调博弈中“噪音”的行为研究,《经济理论杂志》,162195-208(2016)·兹比尔1369.91039
[24] 蒙塔那利亚,A。;Saberi,A.,《社交网络中创新的传播》,《美利坚合众国国家科学院院刊》,107,47,20196-20201(2010)
[25] Morris,S.,《传染病,经济研究评论》,67,1,57-78(2000)·Zbl 0960.91016号
[26] 拉马齐,P。;Cao,M.,有限异质人群中最佳响应更新规则下的异步决策动力学,IEEE自动控制汇刊,63,3,742-751(2018)·Zbl 1390.91058号
[27] 拉马齐,P。;Cao,M.,有限异质种群中线性阈值决策动力学的收敛性,Automatica,119,文章109063 pp.(2020)·Zbl 1451.91046号
[28] 拉马齐,P。;瑞尔,J。;Cao,M.,合格或不合格个人的网络往往会做出令人满意的决定,《美国国家科学院院刊》,113,46,12985-12990(2016)
[29] Ramírez-Llanos,E。;Sonia,M.,《病毒传播控制的分布式动力学》,Automatica,76,41-48(2017)·Zbl 1352.93090号
[30] Riehl,J。;拉马齐,P。;Cao,M.,基于激励的二进制决策网络异步最佳响应动态控制,IEEE网络系统控制事务,6,2,727-736(2019)·Zbl 1515.93113号
[31] Smith,J.M.,《进化与博弈论》(1982),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 0526.90102号
[32] Szabó,G。;瓦尔加,L。;Borsos,I.,《二方规则网络上的进化配对硬币游戏》,《物理评论》E,89,第042820页,(2014)
[33] Tan,S。;吕,J。;Hill,D.J.,《分析和干预一般网络随机漂移的理论框架》,IEEE自动控制汇刊,60,2,576-581(2015)·Zbl 1360.60158号
[34] 唐,F。;法德卢拉,Z.M。;加藤,N。;小野,F。;Miura,R.,AC-POCA:联合无人机和D2D网络中基于反协调游戏的部分重叠信道分配,IEEE车辆技术汇刊,67,2,1672-1683(2018)
[35] Yang,Y。;Li,X.,朝向网络顶点覆盖的雪堆游戏优化,IEEE控制论汇刊,43,3,948-956(2013)
[36] 曾,X。;陈,J。;Liang,S。;Hong,Y.,分布式非光滑多集群博弈的广义Nash均衡寻求策略,Automatica,103,20-26(2019)·Zbl 1411.91032号
[37] 张,C。;李强。;Zhu,Y。;Han,J。;Zhang,J.,《循环网络上分工博弈的进化动力学》,《欧洲控制杂志》,53,1-9(2020)·Zbl 1447.91026号
[38] 张,C。;Zhu,Y。;陈,Z。;Zhang,J.,分担成本形式的惩罚在合作困境博弈中促进利他主义,理论生物学杂志,420,7128-134(2017)·Zbl 1371.91017号
[39] 赵,D。;Yang,S。;韩,X。;张,S。;Wang,Z.,通过消息传递拆卸网络和顶点覆盖,IEEE电路和系统交易II:快讯,67,11,2732-2736(2020)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。