×

囚犯困境博弈中多个经验丰富的引导者影响下的合作行为。 (英语) Zbl 07736277号

摘要:在进化博弈论中,群体合作行为的产生和维持通常受到高薪离职行为的诱惑。近年来,除了模仿规则外,个体在有限信息下的适应能力也是调整策略的关键,例如,个体基于强化学习规则,通过判断以前的表现是否令人满意。在现实场景中,经验丰富的人通常会领导那些缺乏经验的人,并在团队中发挥指导作用。在这里,我们提出了一个多向导博弈模型。网络每一层的玩家扮演不同的角色,遵循不同的策略更新规则。具体来说,引导者使用强化学习规则来更新他们在上层网络中的策略,引导参与者使用基于报酬的模仿规则来更新其在下层网络中的战略,下层的引导者开始参考上层有经验的引导者来更新他们的策略。大量蒙特卡罗模拟结果表明,小组中缺乏经验的个人能够在多个导游的经验指导下学习他人的经验。在模拟社会困境时,除了改进群体决策外,合作行为也可以保持在较高的水平。

MSC公司:

91轴 博弈论
92天xx 遗传学和种群动力学
92至XX 生物学和其他自然科学
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 鲍威尔,W.W。;怀特,D.R。;科普特,K.W。;Owen-Smith,J.,《网络动力学和领域进化:生命科学中组织间合作的增长》,美国社会学杂志。,110, 4, 1132-1205 (2005)
[2] Nowak,M.A.,《进化动力学:探索生命方程》(2006),哈佛大学出版社·Zbl 1115.92047号
[3] Wang,Z。;Jusup,M。;王,R。;史,L。;伊瓦萨,Y。;莫雷诺,Y。;Kurths,J.,《Onymity促进社会困境实验中的合作》,《科学》。高级,3,3,e1601444(2017)
[4] 李伟(Li,W.)。;陈,Z。;Jin,K。;Wang,J。;袁,L。;顾,C。;江,L。;Perc,M.,《在社会困境中联合产生强大合作的移动性和网络互惠选项》,Appl。数学。计算。,435, 127456 (2022) ·Zbl 1510.91134号
[5] Jusup,M。;霍尔姆,P。;金泽,K。;Takayasu,M。;罗米奇一世。;Wang,Z。;Geček,S。;利皮奇,T。;波多布尼克,B。;Wang,L.,社会物理学,物理学。众议员,948,1-148(2022)
[6] Smith,J.M.,《进化与游戏理论》(1982),剑桥大学出版社·Zbl 0526.90102号
[7] Ritzberger,K。;Weibull,J.W.,常态博弈中的进化选择,计量经济学:J.Econ。《社会学杂志》,1371-1399(1995)·Zbl 0841.90127号
[8] 霍夫鲍尔,J。;Sigmund,K.,《进化游戏与人口动力学》(1998),剑桥大学出版社·Zbl 0914.90287号
[9] Bahk,J。;Baek,S.K。;Jeong,H.C.,《循环上的远程囚犯困境游戏》,Phys。修订版E,99,1,012410(2019)
[10] Wettergren,T.A.,具有延迟支付的n人雪堆游戏的复制动力学,Appl。数学。计算。,404, 126204 (2021) ·Zbl 1510.91041号
[11] Zhang,Y。;Wang,J。;丁,C。;夏,C.,空间公共物品博弈中个体差异和投资异质性对集体合作的影响,Knowl。基于系统。,136, 150-158 (2017)
[12] Nowak,M.A.,合作进化的五条规则,《科学》,31458051560-1563(2006)
[13] Smith,J.M.,群体选择和亲属选择,《自然》,201492411145-1147(1964)
[14] Nowak,医学硕士。;Sigmund,K.,《间接互惠的进化》,《自然》,437、7063、1291-1298(2005)
[15] 铃木,S。;Kimura,H.,《间接互惠对信息传输成本很敏感》,科学。代表,3,1,1435(2013)
[16] 李,X。;Jusup,M。;Wang,Z。;李,H。;史,L。;波多布尼克,B。;斯坦利,H.E。;哈夫林,S。;Boccaletti,S.,《惩罚在社会困境实验中削弱了网络互惠的好处》,Proc。国家。阿卡德。科学。,115, 1, 30-35 (2018)
[17] 伊藤,H。;Tanimoto,J.,《衡量社会困境优势的阶段性方案》,R.Soc.Open Sci。,5, 10, 181085 (2018)
[18] Nowak,医学硕士。;May,R.M.,《进化博弈与空间混沌》,《自然》,359,6398,826-829(1992)
[19] 戴,Z。;陈,Y。;李,J。;法姆·J。;Bezerianos,A。;Sun,Y.,时间网络中的时间效率评估和小世界特性,科学。代表,6,1,34291(2016)
[20] e2013825118号·Zbl 1485.05170号
[21] Wang,Z。;Szolnoki,A。;Perc,M.,《相互依存网络上公共合作的演变:偏向效用函数的影响》,Europhys。莱特。,97, 4, 48001 (2012)
[22] 医学博士桑托斯。;Dorogovtsev,S.N。;Mendes,J.F.,《相互依存网络中耦合进化博弈中的偏见模仿》,科学。代表,4,1,1-6(2014)
[23] 金,Q。;Wang,L。;夏,C。;Wang,Z.,《相互依存网络游戏中的自发对称性破缺》,科学。代表,4,1,4095(2014)
[24] 王,B。;陈,X。;Wang,L.,相互依存网络之间的概率互联促进了公共物品博弈中的合作,J.Stat.Mech:Theory Exp.,2012,11,P11017(2012)
[25] 胡克。;Tao,Y。;马云(Ma,Y.)。;Shi,L.,同伴压力导致的惩罚解决了相互依存网络上的社会困境,科学。代表,11,1,15792(2021)
[26] Perc,M.,《多层网络中的扩散动力学和信息传播:概述》,《欧洲物理学》。J.规格顶部。,228, 11, 2351-2355 (2019)
[27] Wang,Z。;Wang,L。;Szolnoki,A。;Perc,M.,《多层网络上的进化博弈:学术讨论会》,欧洲物理学。J.B,88,1-15(2015)
[28] 宋,Z。;郭,H。;贾,D。;Perc,M。;李,X。;Wang,Z.,第三方干预缓解相互依存网络上的冲突,Appl。数学。计算。,403, 126178 (2021) ·Zbl 1510.91035号
[29] 贾,D。;沈,C。;李,X。;博卡莱蒂,S。;Wang,Z.,基于能力的进化促进了相互依存图形中的合作,Europhys。莱特。,127, 6, 68002 (2019)
[30] 莫雷诺,Y。;Perc,M.,《关注多层网络》,新。物理学杂志。,22, 1, 010201 (2019)
[31] Buldyrev,S.V。;Parshani,R。;保罗·G。;斯坦利,H.E。;Havlin,S.,《相互依赖网络中的灾难性故障级联》,《自然》,464,7291,1025-1028(2010)
[32] Helbing,D.,《全球网络化风险和如何应对》,《自然》,497,7447,51-59(2013)
[33] Kivelä,M。;阿里纳斯,A。;Barthelemy,M。;Gleeson,J.P。;莫雷诺,Y。;Porter,M.A.,多层网络,J.Complex Netw。,2, 3, 203-271 (2014)
[34] 博卡莱蒂,S。;Bianconi,G。;克里亚多,R。;德尔·杰尼奥,C.I。;Gómez Gardenes,J。;罗曼斯,M。;Sendina-Nadal,I。;Wang,Z。;Zanin,M.,多层网络的结构和动力学,物理学。代表,544,1,1-122(2014)
[35] 胡克。;王,P。;He,J。;Perc,M。;Shi,L.,多种群复杂进化相互作用,物理学。版本E,107,4,044301(2023)
[36] 贾,D。;郭,H。;宋,Z。;史,L。;邓,X。;Perc,M。;Wang,Z.,强化学习中的局部和全局刺激,新泽西州物理学。,2021年8月23日
[37] 北增田。;Nakamura,M.,《迭代囚犯困境中动态期望水平强化学习模型的数值分析》,J.Theor。生物学,278,1,55-62(2011)·Zbl 1307.91029号
[38] 宋,Z。;郭,H。;贾,D。;Perc,M。;李,X。;Wang,Z.,强化学习促进合作的最佳交互强度,神经计算,513,104-113(2022)
[39] 贾,D。;李·T。;Zhao,Y。;张,X。;Wang,Z.,在强化学习下,空节点影响条件合作,应用。数学。计算。,413, 126658 (2022) ·Zbl 1510.91023号
[40] Wang,L。;贾,D。;张,L。;朱,P。;Perc,M。;史,L。;Wang,Z.,Lévy noise通过强化学习促进囚犯困境博弈中的合作,非线性动力学。,108, 2, 1837-1845 (2022)
[41] Ezaki,T。;Y.Horita。;竹泽,M。;北卡罗来纳州Masuda的强化学习解释了条件合作及其情绪化的表亲PLoS Compute。生物,12,7,e1005034(2016)
[42] 你,T。;张,H。;Zhang,Y。;李强。;张,P。;杨,M.,囚犯困境博弈中经验指导者对合作行为的影响,应用。数学。计算。,426, 127093 (2022) ·Zbl 1510.91044号
[43] Manly,B.F.,《生物学中的随机、自举和蒙特卡罗方法》,Chapman和Hall/CRC(1997)·Zbl 0918.62081号
[44] 阿尔瓦雷兹·罗德里格斯(Alvarez-Rodriguez),美国。;巴蒂斯顿,F。;德阿鲁达,G.F。;莫雷诺,Y。;Perc,M。;拉托拉,V.,《社会网络中高阶交互的进化动力学》,《自然·人类·行为》。,5, 5, 586-595 (2021)
[45] De Freitas,J。;托马斯,K。;DeScioli,P。;Pinker,S.,《人类社会生活中的常识、协调和战略思维化》,Proc。国家。阿卡德。科学。,116, 28, 13751-13758 (2019)
[46] Tanimoto,J。;Sagara,H.,两层对称博弈中困境发生与弱优势策略存在之间的关系,生物系统,90,1,105-114(2007)
[47] 科库博,S。;Jusup,M。;Tanimoto,J.,进化游戏中两难困境强度的通用尺度,Phys。Life Rev.,14,1-30(2015年)
[48] Arefin,M.R。;卡比尔,K.A。;Jusup,M。;伊藤,H。;Tanimoto,J.,《社会效率赤字解读社会困境》,科学。代表,10,1,16092(2020年)
[49] Tanimoto,J.,《流行病的社会物理学方法》(2021),斯普林格·Zbl 1495.92002年
[50] Szabó,G。;武科夫,J。;Szolnoki,A.,二维格子上进化囚犯困境游戏的相图,Phys。版本E,72,4,047107(2005)
[51] Wang,Z。;Perc,M.,《追求适者生存和促进囚犯困境游戏中的合作》,Phys。版本E,82,2,021115(2010)
[52] Perc,M。;Wang,Z.,《异质愿望促进囚犯困境游戏中的合作》,《公共科学图书馆·综合》,5,12,e15117(2010)
[53] Szolnoki,A。;Perc,M。;Szabó,G.,空间公共物品游戏中噪声对合作的非拓扑影响,Phys。版本E,80,5,056109(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。