×

带乘性噪声的两策略进化博弈的几乎必然指数稳定性。 (英语) Zbl 1533.91058号

摘要:本文研究了参与者受到乘性噪声干扰的随机两策略进化博弈。我们提出了一个随机复制者动态模型来研究一般两策略博弈的几乎必然指数稳定性(ASES)。与带有加性噪声的确定性博弈和随机博弈相比,我们最有趣的结果是关于乘性噪声对大混合种群中合作行为的影响。我们建立了随机噪声的充分条件,以确保一般两策略博弈的稳定平衡点确实是ASES。随机李雅普诺夫框架用于证明随机稳定性,其中找到合适的李雅普诺夫函数是我们的关键和挑战。为了验证我们的理论结果,我们模拟了三种不同类型的两策略博弈模型(雪堆博弈、猎鹿博弈和囚犯困境)。

MSC公司:

91A22型 进化游戏
91A15型 随机对策,随机微分对策
93D23型 指数稳定性
93E15型 控制理论中的随机稳定性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] K.Behrstock、M.BenaíM、M.W.Hirsch,《网络囚犯困境游戏的Smale策略》,2015年。arXiv预印本:1503.08481·Zbl 1360.91025号
[2] Belgiioso,G。;Grammatico,S.,具有可分离耦合约束和不可微代价函数的聚合博弈中的半分散纳什均衡寻求,IEEE控制系统。莱特。,1, 400-405 (2017)
[3] Bensoussan,A。;Frehse,J。;Yam,P.,《平均场游戏和平均场类型控制理论》(2013),施普林格·Zbl 1287.93002号
[4] Cressman,R.,《进化动力学和扩展形式游戏》(2003),麻省理工学院出版社·Zbl 1067.91001号
[5] 埃特萨米,S.R。;Başar,T.,社交网络上竞争扩散游戏中均衡的复杂性,Automatica,6810-110(2016)·Zbl 1414.91071号
[6] Foster,D。;Young,P.,随机进化博弈动力学,Theor。大众。《生物学》,38,219-232(1990)·Zbl 0703.92015号
[7] 易卜生-延森,R。;查特吉,K。;Nowak,M.A.,生态和进化空间动力学的计算复杂性,Proc。国家。阿卡德。科学。,112, 15636-15641 (2015)
[8] Imhof,L.A.,《随机复制因子动力学的长期行为》,Ann.Appl。探针。,15, 1019-1045 (2005) ·Zbl 1081.60045号
[9] Kawano,Y。;龚,L。;Anderson,理学学士。;Cao,M.,环境反馈下两个社区的进化动力学,IEEE控制系统。莱特。,3, 254-259 (2019)
[10] Kebriaei,H。;Rahimi-Kian,A。;艾哈迈达巴迪,M.N.,《不完全信息古诺博弈中基于模型和基于学习的决策:状态估计方法》,IEEE Trans。系统。网络人:系统。,45, 713-718 (2014)
[11] Lancichinetti,A。;福图纳托,S.,《动物冲突的逻辑》,《自然》,246,15-18(1973)·Zbl 1369.92134号
[12] Levine,W.S.,《控制系统手册:控制系统先进方法》(2010),CRC出版社
[13] Liang,H。;曹,M。;Wang,X.,进化雪堆游戏随机稳定平衡点的分析和转移,系统。控制信函。,85, 16-22 (2015) ·Zbl 1322.93101号
[14] Liang,H。;Li,T.,图上进化雪堆游戏的随机稳定平衡,IFAC-PapersOnLine,49,222-227(2016)
[15] Liang,H。;苏,H。;Wang,Y。;彭,C。;费,M。;Wang,X.,随机乘性噪声下的连续时间观点动力学,IEEE Trans。电路系统。II Express Briefs,66,988-992(2018)
[16] Liang,H。;Zhou,Z。;张,F。;彭,C。;王毅,进化囚犯困境的随机稳定性,澳大利亚和新西兰控制会议,2018,1-6(2018)
[17] 利伯曼,E。;Hauert,C。;Nowak,M.A.,《图的进化动力学》,《自然》,433312-316(2005)
[18] Lv,Y。;Ren,X.,带强化学习的多人混合零和游戏的近似纳什解,IEEE Trans。系统。网络人:系统。,49, 2739-2750 (2018)
[19] Mao,X.,随机微分方程及其应用(2007),Elsevier·Zbl 1138.60005号
[20] Nałeöcz-Jawecki,P。;Mieökisz,J.,进化博弈中的Mean势定律,物理学。修订稿。,120, 028101-028106 (2018)
[21] Perc,M.,《空间囚徒困境游戏中的一致性共振》,新J.物理学。,8, 22 (2006)
[22] Perc,M.,《进化囚徒困境中由噪音和网络变异引起的合作中的双重共振》,《新物理学杂志》。,82183(2006年)
[23] Perc,M.,空间囚徒困境博弈中随机收益变化的高斯分布到利维分布的转换,Phys。E版,75,第022101条,pp.(2007)
[24] 秦,J。;陈,Y。;傅伟(Fu,W.)。;Kang,Y。;Perc,M.,《社区多样性促进社会困境中的合作》,IEEE Access,65003-5009(2018)
[25] 拉马齐,P。;Cao,M.,有限异质人群中最佳响应更新规则下的异步决策动力学,IEEE Trans。自动。控制,63742-751(2017)·Zbl 1390.91058号
[26] 拉马齐,P。;Riehl,J。;Cao,M.,符合或不符合个人的网络往往会做出令人满意的决定,Proc。国家。阿卡德。科学。,113, 12985-12990 (2016)
[27] 兰德·D·G。;Nowak,医学硕士。;福勒,J.H。;Christakis,N.A.,静态网络结构可以稳定人类合作,Proc。国家。阿卡德。科学。,111, 17093-17098 (2014)
[28] Riehl,J。;拉马齐,P。;Cao,M.,基于激励的二进制决策网络异步最佳响应动态控制,IEEE Trans。控制网络系统。,6, 727-736 (2018) ·Zbl 1515.93113号
[29] 舒斯特,P。;Sigmund,K.,Replicator dynamics,J.Theor。生物学,100533-538(1983)
[30] Sheng,L。;张,W。;Gao,M.,乘性噪声随机马尔可夫跳跃系统的纳什均衡策略与h2/h∞控制之间的关系,IEEE Trans。自动。控制,592592-2597(2014)·Zbl 1360.93786号
[31] 隋,X。;Cong,R。;李凯。;Wang,L.,n人雪堆游戏的进化动力学,Phys。莱特。A、 3792922-2934(2015)·Zbl 1349.91046号
[32] Sun,H。;Yan,L。;Li,L.,带马尔可夫跳跃和乘性噪声的线性二次随机微分对策:无限时间情形,Int.J.Innov。计算。信息控制,11349-361(2015)
[33] P.D.泰勒。;Jonker,L.B.,进化稳定策略与博弈动力学,数学。生物科学。,40, 145-156 (1978) ·Zbl 0395.90118号
[34] Tembine,H。;奥尔特曼,E。;El-Azouzi,R。;Hayel,Y.,《无线网络中的进化游戏》,IEEE Trans。系统。人类网络。B部分(控制论),40634-646(2009)
[35] 特拉尔森,A。;帕切科,J.M。;Imhof,L.A.,《随机性和进化稳定性》,Phys。E版,74(2006),021905-1-6
[36] Van Huyck,J.等人。;Stahl,D.O.,《类似猎鹿游戏中的条件行为和学习》,《实验经济学》。,21, 513-526 (2018)
[37] 王,Q。;He,N。;Chen,X.,《大人口资源分配公共物品博弈的复制动力学》,应用。数学。计算。,328, 162-170 (2018) ·Zbl 1427.91046号
[38] 袁,Y。;王,Z。;郭,L.,带干扰补偿的离散时间非线性二次对策的事件触发策略设计:非合作情况,IEEE Trans。系统。网络人:系统。,48, 1885-1896 (2017)
[39] 张杰。;Zhu,Y。;Chen,Z.,多社区网络上多智能体系统的进化博弈动力学,IEEE Trans。系统。网络人:系统。,50, 4513-4529 (2018)
[40] 张,T。;Wang,Y。;蒋,X。;Zhang,W.,随机\(\算子名称的纳什博弈方法{H} _2/\操作员姓名{高}_\infty)控制,(概述和进一步研究课题。2015年第34届中国控制会议(CCC)(2015)),2848-2853
[41] Zhou,Z。;Liang,H。;苏,H。;Xu,X。;杜伟,正则图上进化两层对策的随机稳定性分析,物理A,535,第122364页,(2019)·Zbl 07571204号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。