×

策略学习中基于模仿和期望信息的证据推理促进了可选空间公共物品博弈中的合作。 (英语) Zbl 1483.91039号

摘要:策略学习机制对进化博弈中系统的均衡状态有重要影响。作为两种常见的个体策略更新规则,成对模仿和抱负驱动的更新在进化博弈的各种模型中得到了广泛的应用。在以前的研究中,通常假设个人只采用一条规则来更新他们的策略。近年来,人们对这两种规则的结合进行了研究,如选择具有一定概率的规则和选择具有互补概率的规则。然而,在这种组合规则下,每个个体每次仍然使用单一来源的信息进行策略选择。本文从多源信息融合的角度扩展了这两个规则的组合,并考虑了获取信息中可能包含的无知情况。由于证据理论在表示具有不确定性和未知性的知识方面具有优势,我们引入证据推理工具来构建一种新的策略学习规则,将模仿和渴望驱动更新的信息作为两个证据,个体通过证据推理来更新策略。基于证据推理的新规则在具有选择性参与的空间公共物品博弈中进行了详细研究,其中个体有三种可选策略,即合作策略、叛逃策略和孤独策略。通过数值模拟,我们发现证据推理可以有效地提高模仿和期望驱动更新的性能,从而在广泛的融合权重范围内促进合作的出现。特别是在协同因素低的地区,合作也可以加强。这些结果可以补充我们从个体学习的角度对合作产生的理解。

MSC公司:

91A22型 进化游戏
91A26型 博弈论中的理性与学习
91A43型 涉及图形的游戏
91B18号 公共产品
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 约翰逊,D.D.P。;Stopka,P。;Knights,S.,《社会学:人类合作之谜》,《自然》,421,911-912(2003)
[2] Pennisi,E.,合作行为是如何演变的,《科学》,309,93(2005)
[3] 兰德·D·G。;Nowak,M.A.,人类合作,趋势认知科学。,17, 413-425 (2013)
[4] 阿克塞尔罗德,R。;Hamilton,W.D.,《合作的演变》,《科学》,2111390(1981)·Zbl 1225.92037号
[5] Maynard,S.J.,《进化与博弈论》(1982),剑桥大学出版社:剑桥大学出版社·Zbl 0526.90102号
[6] Perc,M。;Gomez-Gardenes,J。;Szolnoki,A。;Floria,L.M。;Moreno,Y.,《结构化种群群体相互作用的进化动力学:综述》,J R Soc Interface,10,文章20120997 pp.(2013)
[7] Tanimoto,J。;Sagara,H.,两层对称博弈中困境发生与弱优势策略存在之间的关系,生物系统,90,105-114(2007)
[8] 王,Z。;科库博,S。;Jusup,M。;Tanimoto,J.,进化游戏中困境强度的通用尺度,《物理生命评论》,14,1-30(2015)
[9] 伊藤,H。;Tanimoto,J.,《衡量社会困境优势的阶段性方案》,《控制合作演变的五条规则中的游戏类变化》,《Roy Soc开放科学》,第5期,第181085页,(2018年)
[10] Tanimoto,J.,假设的双层和多层游戏的两个共同进化模型中互惠效应的差异,《物理评论E》,87,第062136页,(2013)
[11] Tanimoto,J.,《进化博弈论及其应用基础》(2015),施普林格出版社·Zbl 1326.91001号
[12] Tanimoto,J.,《社会物理学的进化游戏:交通流和流行病分析》(2019年),斯普林格出版社·Zbl 1419.91005号
[13] Quan,J。;李,X。;Wang,X.,空间公共物品博弈中合作的演化与有条件同伴排斥,Chaos,29,第103137页(2019)
[14] Quan,J。;杨,X。;王,X。;杨,J.-。B。;Wu,K。;Dai,Z.,预扣税判决和处罚促进不完全信息下的间接互惠合作,《电子商务期刊》,128,28001(2019)
[15] Quan,J。;唐,C。;周,Y。;王,X。;杨,J.-。B.,空间公共物品博弈中合作的容忍度和声誉依赖性模仿声誉评估,混沌孤子分形,131,第109517条,pp.(2020)·Zbl 1495.91058号
[16] Quan,J。;周,Y。;张,M。;唐,C。;Wang,X.,群体间异质规模收益系数对空间公共物品博弈中合作出现的影响,J Stat Mech,Article 043402 pp.(2019)
[17] Quan,J。;郑洁。;王,X。;Yang,X.,异步排除对随机进化可选公共产品游戏中合作进化的好处,Sci Rep,92008(2019)
[18] Quan,J。;张,M。;周,Y。;王,X。;杨,J.-。B.,具有环境反馈的动态规模回报系数促进空间公共产品博弈中的合作,J Stat Mech,文章103405 pp.(2019)·兹比尔1456.91015
[19] Quan,J。;杨伟(Yang,W.)。;李,X。;王,X。;杨,J.-。B.,空间公共物品博弈中合作演变的动态成本社会排斥,应用数学计算,372,第124994条,pp.(2020)·Zbl 1433.91027号
[20] Nowak,M.A.,《合作进化的五条规则》,《科学》,3141560-1563(2006)
[21] Szabo,G。;Fath,G.,《图上的进化游戏》,Phys Rep,446,97-216(2007)
[22] Perc,M。;Jordan,J.J。;兰德·D·G。;王,Z。;博卡莱蒂,S。;Szolnoki,A.,《人类合作的统计物理学》,《物理学代表》,687,1-51(2017)·兹比尔1366.80006
[23] Javarone,M.A.,《空间囚犯与记忆软件代理困境的统计物理学》,《欧洲物理杂志》B,89,42(2016)
[24] Hauert,C。;Szabo,G.,《博弈论与物理学》,《美国物理学杂志》,第73期,第405-414页(2005年)·Zbl 1219.82098号
[25] 王,Z。;Bauch,C.T。;巴塔查里亚,S。;d'Onofrio,A。;Manfredi,P。;Perc,M.,《疫苗接种的统计物理》,Phys Rep,664,1-113(2016)·Zbl 1359.92111号
[26] D’Orsogna,M.R。;Perc,M.,《犯罪的统计物理学:综述》,《物理生活评论》,第12期,第1-21页(2015年)
[27] 卡普拉罗,V。;Perc,M.,《社会物理学的重大挑战:追求道德行为》,《前沿物理学》,6,107(2018)
[28] 胡伯曼,B.A。;N.S.Glance,《进化游戏和计算机模拟》,美国国家科学院院刊,907716-7718(1993)·Zbl 0800.92168号
[29] Perc,M.,基于代理模型中子系统解决方案的稳定性,《欧洲物理杂志》,39,第014001页,(2018)
[30] Perc,M.,人类合作模型中的阶段转换,Phys-Lett A,380,2803-2808(2016)
[31] Szolnoki,A。;Perc,M。;Szabó,G.,《噪音对空间公益游戏合作的非拓扑影响》,《物理评论E》,80,第056109页,(2009年)
[32] 陈,X。;Fu,F。;Wang,L.,《随机双日轮换机制下地方贡献促进合作》,Physica A,3875609-5615(2008)
[33] 邓,X。;张,Z。;邓,Y。;刘,Q。;Chang,S.,自适应win-stay-losse-shift参考选择机制促进方形格子上的合作,应用数学计算,284,322-331(2016)·Zbl 1410.91226号
[34] 刘,Y。;陈,X。;张,L。;Wang,L。;Perc,M.,《Win-stay-lose-learn促进空间囚犯困境游戏中的合作》,《公共科学图书馆·综合》,7,e30689(2012)
[35] 杨,H.-。十、。;荣,Z。;卢,P.-。医学硕士。;曾Y.-。Z.,愿望对结构化人群公共合作的影响,Physica A,391,4043-4049(2012)
[36] Nowak,医学硕士。;佐佐木,A。;泰勒,C。;Fudenberg,D.,有限种群中合作和进化稳定性的出现,《自然》,428646-650(2004)
[37] Quan,J。;Wang,X.J.,具有任意选择强度和突变的广义moran过程中的进化博弈,Chin Phys B,20,文章030203 pp.(2011)
[38] Quan,J。;刘伟。;朱棣文。;Wang,X.,有限种群中进化可选公共产品博弈的随机动力学和稳定均衡,Physica A,502123-134(2018)·Zbl 1494.91056号
[39] Quan,J。;刘伟。;Chu,Y。;Wang,X.,《准生与死过程中带有惩罚的随机演化自愿公共物品博弈》,科学代表,第7期,第16110页(2017年)
[40] Messerschmidt,L。;Engelbrecht,A.P.,《使用基于PSO的竞争学习方法学习游戏》,IEEE Evolut Compute,8280-288(2004)
[41] Quan,J。;Yang,X.K。;Wang,X.J.,基于粒子群优化的具有自我和同伴惩罚的连续空间公共物品博弈,Phys Lett A,3821721-1730(2018)·Zbl 1398.91080号
[42] Quan,J。;Yang,X.K。;Wang,X.J.,基于粒子群优化学习和合作进化的连续贡献空间公共物品博弈,Physica A,505,973-983(2018)
[43] Riechmann,T.,《遗传算法学习与进化博弈》,《经济动态控制杂志》,第25期,第1019-1037页(2001年)·Zbl 0979.91007号
[44] 伯琴霍尔,C。;北卡罗来纳州卡斯特里诺斯。;Metcalfe,S.,《进化建模中的遗传算法》,《进化经济学杂志》,第7375-393页(1997年)
[45] 方,Y。;Benko,T。;Perc,M。;Xu,H.,空间公共物品博弈中的异质性驱动行为与合作,科学代表,97655(2019)
[46] 杜,J。;吴,B。;Altrock,P.M。;Wang,L.,有限人口中多层博弈的期望动力学,J R Soc Interface,11,Article 20140077 pp.(2014)
[47] 王,X。;顾,C。;赵,J。;Quan,J.,《结合模仿和抱负驱动更新规则的进化游戏动力学》,《物理评论E》,100,第022411页,(2019年)
[48] Xu,K。;李凯。;Cong,R。;Wang,L.,结构种群中模仿动力学和愿望动力学共存指导下的合作,EPL,11748002(2017)
[49] Szabó,G。;Tőke,C.,方格子上的进化囚徒困境博弈,《物理评论E》,58,69-73(1998)
[50] M Altrock,P。;Traulsen,A.,《弱选择下进化博弈的固定时间》,《新物理学杂志》,第11期,第013012页(2009)
[51] 特拉尔森,A。;Nowak,医学硕士。;帕切科,J.M.,《随机回报评估增加了选择的温度》,《Theor Biol杂志》,244349-356(2007)·Zbl 1450.91006号
[52] 特拉尔森,A。;Nowak,医学硕士。;Pacheco,J.M.,入侵和固定的随机动力学,《物理学评论E》,74,第011909页,(2006)
[53] Szabó,G。;Szolnoki,A。;Vukov,J.,空间囚徒困境游戏中的动态规则选择,EPL,87,18007(2009)
[54] Perc,M。;Wang,Z.,《异质愿望促进囚犯困境游戏中的合作》,《公共科学图书馆·综合》,5,e15117(2010)
[55] 陈,X。;Wang,L.,《小世界网络游戏中适当回报期望引发的合作促进》,Phys Rev E,77,第017103条,pp.(2008)
[56] 杜,J。;吴,B。;Wang,L.,结构化种群中的吸气动力学就像在一个混合良好的种群中一样,Sci Rep,58014(2015)
[57] 沈,C。;楚,C。;Shi,L。;Perc,M。;Wang,Z.,基于抱负的链接权重共同进化促进空间囚犯困境游戏中的合作,Roy Soc Open Sci,5,Article 180199 pp.(2018)
[58] 王,X.-。J。;顾,C.-。法律。;Lv,S.-。J。;Quan,J.,结合莫兰和模仿过程的进化博弈动力学,中国物理学B,28,第020203页,(2019)
[59] Dempster,A.P.,贝叶斯推断的推广,J R Stat Soc,30,205-247(1968)·Zbl 0169.21301号
[60] Shafer,G.,《证据的数学理论》(1976),普林斯顿大学出版社:普林斯顿大学出版·Zbl 0359.62002号
[61] 舒·G。;杜,X。;Li,Y.,《环境信息考虑促进囚犯困境游戏中的合作》,《混沌孤子分形》,91,689-694(2016)·Zbl 1375.91029号
[62] 李毅。;兰,X。;邓晓云(Deng,X.Y.)。;Sadiq,R。;邓毅,《战略更新的综合考虑促进囚徒困境博弈中的合作》,Physica A,403284-292(2014)·Zbl 1402.91049号
[63] Zhang,Y.F。;舒·G。;Li,Y.,《根据当地环境进行战略更新以增强囚犯困境游戏中的合作》,《应用数学计算》,301,224-232(2017)·Zbl 1411.91097号
[64] 邓晓云(Deng,X.Y.)。;郑,X。;苏晓云。;Chan,F.T.S。;胡,Y。;Sadiq,R.,《多准则决策过程中的证据博弈理论框架》,应用数学计算,244783-793(2014)·Zbl 1335.91028号
[65] 邓晓云(Deng,X.Y.)。;刘,Q。;Deng,Y.,带有信念结构回报的矩阵游戏,应用数学计算,273868-879(2016)·Zbl 1410.91010号
[66] 邓晓云(Deng,X.Y.)。;韩德清。;Dezert,J。;邓,Y。;Shyr,Y.,《进化博弈论视角下的证据组合》,IEEE Trans Cybern,46,2070-2082(2016)
[67] Quan,J。;周,Y。;王,X。;杨,J.-。B.,基于声誉和回报的信息融合促进空间公共物品博弈中的合作,应用数学计算,368,第124805条,pp.(2020)·Zbl 1433.91028号
[68] 周,M。;刘,X.-。B。;杨,J.-。B。;陈,Y.-。W。;Wu,J.,具有多种属性的证据推理方法和基于熵的权重分配,基于知识的系统,163,358-375(2019)
[69] 周,M。;刘,X.-。B。;杨,J.-。B.,基于证据推理的模糊权重和效用下MCDA非线性规划模型,国际智能系统杂志,25,31-58(2010)·Zbl 1185.68661号
[70] 傅,C。;杨,J.-。B。;Yang,S.-。L.,基于专家可靠性的群体证据推理方法,《欧洲运营研究杂志》,246886-893(2015)·Zbl 1346.91045号
[71] 傅,C。;Chang,W。;徐,D。;Yang,S.,基于标准可靠性和解决方案可靠性的证据推理方法,计算工业工程,128,401-417(2019)
[72] 杨,J.-。B。;Xu,D-L.,证据组合的证据推理规则,Artif Intell,205,1-29(2013)·Zbl 1334.68225号
[73] Hauert,C。;蒙特,S.D。;霍夫鲍尔,J。;Sigmund,K.,《志愿成为公共物品游戏合作的红皇后机制》,《科学》,2961129-1132(2002)
[74] Szabó,G。;Hauert,C.,《自愿参与的进化囚犯困境博弈》,《物理评论E》,66,第062903页,(2002)
[75] Szolnoki,A。;Perc,M.,《空间公共物品博弈中容忍策略的竞争》,《新物理学杂志》,第18期,第083021页(2016年)·Zbl 1456.91019号
[76] Hauert,C。;德蒙特,S。;霍夫鲍尔,J。;Sigmund,K.,《可选公益游戏的复制者动力学》,J Theor Biol,218187-194(2002)
[77] 特拉尔森,A。;Hauert,C。;De Silva,H。;Nowak,医学硕士。;Sigmund,K.,《进化游戏中的探索动力学》,美国国家科学院学报,106709(2009)·Zbl 1202.91029
[78] Zadeh,L.A.,《Shafer证据数学理论评论》,AI Mag,581-83(1984)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。