×

群体计算作为一个合作问题:进化方法。 (英语) Zbl 1267.82155号

摘要:合作是物理学界十分关注的社会经济问题之一。这个问题主要是通过研究囚徒困境或公共物品博弈来考虑的。在这里,我们通过研究群组计算环境下的合作向前迈出了一步。我们引入了一个松散地基于委托代理理论的模型,在该模型中,人们(工人)通过计算答案并向问题提出者(主)报告来为分布式问题的解决做出贡献。为了超越涉及纳什均衡概念的经典方法,我们研究了一个进化框架,在这个框架中,主人和工人都通过强化学习来更新他们的行为。使用马尔可夫链方法,我们从理论上表明,在某些条件下(不是非常严格的条件下),主控者可以确保过程结果的可靠性。然后,我们通过数值模拟研究了模型,发现收敛性,即系统达到一个总是能产生可靠答案的点,通常可能比理论计算给出的上限快得多。我们还讨论了硕士的容忍度对叛逃者的影响,而这一理论并未提供相关信息。讨论表明,即使在公差非常大的情况下,该系统也能正常工作。最后,我们讨论了我们的结果以及进一步开展这项研究的可能方向。

MSC公司:

82天99 统计力学在特定类型物理系统中的应用
68T42型 Agent技术与人工智能
91B69型 异构代理模型
82B20型 格系统(伊辛、二聚体、波茨等)和平衡统计力学中出现的图上系统
91B80型 统计和量子力学在经济学中的应用(经济物理学)
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动、学习理论、工业过程等)上的应用

软件:

BOINC公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 鲍尔,P.:《临界质量:一件事如何导致另一件事》。Arrow Books,伦敦(2005)
[2] Mantegna,R.N.,Stanley,H.E.:《经济物理学导论:金融中的相关性和复杂性》。剑桥大学出版社,剑桥(1999)·Zbl 1138.91300号 ·doi:10.1017/CBO9780511755767
[3] Castellano,C.,Fortunato,S.,Loreto,V.:社会动力学的统计物理学。修订版Mod。物理。81, 591-646 (2009) ·doi:10.1103/RevModPhys.81.591
[4] P.W.安德森:更多是不同的。《科学》177,393-396(1972)·doi:10.1126/science.177.4047.393
[5] Goldenfeld,N.:关于相变和重整化群的讲座。Addison-Wesley,波士顿(1992)·Zbl 0825.76872号
[6] 谢林,T.C.:微观动机和宏观行为。诺顿,纽约(1978)
[7] Stauffer,D.、Solomon,S.:伊辛、谢林和自组织隔离。欧洲物理学。J.B 57,473-479(2007)·doi:10.1140/epjb/e2007-00181-8
[8] Stigler,G.J.:效用理论的发展:I,II。政治经济学杂志。58, 307-327, 373-396 (1950). ·doi:10.1086/256962
[9] Goffman,E.:战略互动。宾夕法尼亚大学出版社,费城(1969年)
[10] von Neumann,J.,Morgenstern,O.:博弈论与经济行为。普林斯顿大学出版社,普林斯顿(1944)·Zbl 0063.05930号
[11] 梅纳德·史密斯,J.:《进化论与博弈论》。剑桥大学出版社,纽约/伦敦(1982)·Zbl 0526.90102号 ·doi:10.1017/CBO9780511806292
[12] Gintis,H.:《理性的边界:博弈论和行为科学的统一》。普林斯顿大学出版社,普林斯顿(2009)·Zbl 1168.91006号
[13] Vega-Redondo,F.:博弈论和经济应用。剑桥大学出版社,剑桥(2003)·Zbl 1041.65001号 ·doi:10.1017/CBO9780511753954
[14] Gintis,H.:《博弈论进化》,第二版。普林斯顿大学出版社,普林斯顿(2009)·Zbl 1161.91005号
[15] 纳什,J.:n人博弈中的平衡点。程序。国家。阿卡德。科学。美国36,48-49(1950)·Zbl 0036.01104号 ·doi:10.1073/pnas.36.1.48
[16] 霍夫鲍尔,J.,西格蒙德,K.:进化博弈与人口动力学。剑桥大学出版社,剑桥(1988)·Zbl 0914.90287号
[17] 霍夫鲍尔,J.,西格蒙德,K.:进化博弈动力学。牛市。美国数学。Soc.40,479-519(2003)·Zbl 1049.91025号 ·doi:10.1090/S0273-0979-03-00988-1
[18] Nowak,M.A.:进化动力学。哈佛大学出版社,哈佛(2006)·Zbl 1115.92047号
[19] Taylor,P.,Jonker,L.:进化稳定策略和博弈动力学。数学。Biosci公司。40, 45-156 (1978) ·Zbl 0395.90118号 ·doi:10.1016/0025-5564(78)90077-9
[20] 达尔文,C.:《人类的后裔与性别选择》。伦敦默里(1871)·doi:10.1037/12294-000
[21] Kollock,P.:《社会困境:合作的剖析》。每年。社会学评论。24, 183-214 (1998) ·doi:10.1146/annurev.soc.24.1.183
[22] Nowak,M.A.:合作进化的五条规则。科学3141560-1563(2006)·doi:10.1126/science.1133755
[23] Roca,C.P.,Cuesta,J.A.,Sánchez,A.:进化博弈论:超越复制动力的时空效应。物理。Life修订版6208-249(2009)·doi:10.1016/j.plrev.2009.08.001
[24] Grujić,J.,Fosco,C.,Araújo,L.,Cuesta,J.A.,Sánchez,A.:中尺度的社会实验:人类扮演空间囚徒困境。《公共科学图书馆·综合》5,e13749(2010)·doi:10.1371/journal.pone.0013749
[25] Gracia-Lázaro,C.,Ferrer,A.,Ruiz,G.,Tarancón,A.,Cuesta,J.A.,Sánchez,A.,Moreno,Y.:当人类陷入囚犯困境时,异质网络不会促进合作。程序。国家。阿卡德。科学。美国10912922-12926(2012)·doi:10.1073/pnas.1206681109
[26] Szabó,G.,Fáth,G.:图上的进化博弈。物理。代表446、97-216(2007)·doi:10.1016/j.physrep.2007.04.004
[27] Perc,M.,Szolnoki,A.:共同进化游戏——迷你评论。生物系统99,109-125(2010)·doi:10.1016/j.biosystems.2009.10.003
[28] Rees,R.:委托人与代理人理论:I,II。牛市。经济。第37号决议,3-26(1985年)。75-97 ·doi:10.1111/j.1467-8586.1985.tb00179.x
[29] Mass-Colell,A.,Whinton,M.,Green,J.:微观经济理论。牛津大学出版社,牛津(1995)·Zbl 1256.91002号
[30] Anderson,D.,BOINC:公共资源计算和存储系统,4-10(2004)
[31] Korpela,E.,Werthimer,D.,Anderson,D.,Cobb,J.,Lebofsky,M.:SETI@主页:SETI的大规模分布式计算。计算。科学。工程3,78-83(2001)·doi:10.1109/5992.895191
[32] Ibercivis公民计算平台。网址:http://www.ibercivis.net
[33] 亚马逊的机械突厥。https://www.mturk.com
[34] Babaioff,M.、Feldman,M.和Nisan,N.:组合代理。载于:《2006年美国机械工程师协会会议记录》,第18-28页(2006年)·Zbl 1258.91082号
[35] Babaioff,M。;费尔德曼,M。;Nisan,N.,《组合代理中的混合策略》,353-364(2006)·Zbl 1210.68119号
[36] Babaioff,M。;费尔德曼,M。;Nisan,N.,《组合代理中的搭便车和免费劳动》,109-121(2009)·Zbl 1262.91102号
[37] 艾登本兹,R。;Schmid,S.,联合审计机构,374-383(2009)
[38] 戈尔,P。;Mironov,I.,《不可加热分布式计算》,425-440(2001)·Zbl 0972.68077号
[39] Heien,E.M.,Anderson,D.P.,Hagihara,K.:在志愿者计算环境中使用不可靠的工人计算低延迟批次。J.网格计算。7, 501-518 (2009) ·doi:10.1007/s10723-009-9131-6
[40] 施奈德曼,J。;Parkes,D.C.,《P2P网络中的理性与自利》,139-148(2003)
[41] 亚伯拉罕一世。;多列夫,D。;戈登,R。;Halpern,J.Y.,《分布式计算与博弈论:理性秘密共享和多方计算的稳健机制》,53-62(2006)·Zbl 1314.68051号
[42] Sarmenta,L.:志愿计算系统的破坏容忍机制。未来一代。计算。系统。18, 561-572 (2002) ·Zbl 1032.68015号 ·doi:10.1016/S0167-739X(01)00077-2
[43] 费尔南德斯·安塔,A。;Ch.乔治奥。;Mosteiro,M.A.,《基于互联网的可靠计算的设计机制》,315-324(2008)
[44] Fernández Anta,A.,Georgiou,Ch.,Mosteiro,M.A.:基于互联网的主从计算的算法机制,与不信任和自私的工作者一起使用。摘自:2010年IPDPS会议记录,第1-11页(2010年)
[45] 博伊德·R、理查德森·P·J:惩罚允许在大规模群体中发展合作(或任何其他)。乙醇。社会生物学。13, 171-195 (1992) ·doi:10.1016/0162-3095(92)90032-Y
[46] Fehr,E.,Gächter,S.:人类的利他惩罚。《自然》415137-140(2002)·doi:10.1038/415137a
[47] Rose,D.,Willemain,T.R.:进化学习的委托代理问题。计算。数学。器官。理论2,139-162(1996)·兹伯利0873.90148 ·doi:10.1007/BF00240424
[48] Bush,R.R.,Mosteller,F.:学习的随机模型。威利,纽约(1955年)·兹比尔0064.39002
[49] 克罗斯,F.G.:适应性经济行为理论。剑桥大学出版社,剑桥(1983)·文件编号:10.1017/CBO9780511983856
[50] Erev,I.,Roth,A.:《预测人们如何玩游戏:在具有独特混合策略均衡的实验游戏中强化学习》,《美国经济》。版本88,848-881(1998)
[51] 卡梅勒,C.F.:行为博弈论:战略互动实验。普林斯顿大学出版社,普林斯顿(2003)·Zbl 1019.91001号
[52] 达菲,J。;Tesfatsion,L.(编辑);Judd,K.L.(编辑),基于代理的模型和人体实验,949-1011(2006),阿姆斯特丹
[53] 梅西,M.W.,弗拉奇,A.:社会困境中的学习动力。程序。国家。阿卡德。科学。美国99,7229-7236(2002)·Zbl 1355.91014号 ·doi:10.1073/pnas.092080099
[54] Izquierdo,S.S.、Izquierto,L.R.、Gotts,N.M.:社会困境中的强化学习动力。J.阿蒂夫。Soc.Soc.模拟。11, 1 (2008)
[55] Izquierdo,L.R。;Izquierdo,S.S。;韦伯,C.(编辑);Elshaw,M.(编辑);Mayer,N.M.(编辑),《2×2游戏中Bush-Mosteller学习算法的动力学》(2008),维也纳
[56] 克里斯托弗鲁,E。;费尔南德斯·安塔,A。;乔治奥,C。;Mosteiro,医学硕士。;Sánchez,A.,《通过进化动力学实现主从计算的可靠性》(2012)·Zbl 1301.68055号
[57] Szepesvári,C.:强化学习算法。Morgan&Claypool,San Rafael(2010年)·Zbl 1205.68320号
[58] Szolnoki,A.,Perc,M.,Szabó,G.:噪声对空间公共物品游戏中合作的拓扑无关影响。物理。版本E 80,056109(2009)·doi:10.1103/PhysRevE.80.056109
[59] Szolnoki,A.,Perc,M.:群体规模对空间公共产品博弈中合作演变的影响。物理。版本E 84,047102(2011)·doi:10.1103/PhysRevE.84.047102
[60] Perc,M.:强烈的异质性会通过群体互动促进合作吗?新J.Phys。2011年12月13日·doi:10.1088/1367-2630/13/12/23027
[61] Gómez-Gardeñes,J.,Romance,M.,Criado,R.,Vilone,D.,Sánchez,A.:网络中尺度下定义的进化博弈:公共物品博弈。混沌21,016113(2011)·Zbl 1345.91002号 ·doi:10.1063/1.3535579
[62] Gómez-Gardeñes,J.,Vilone,D.,Sánchez,A.:消除社会和群体异质性:复杂网络上的公共物品游戏。欧洲鱼。莱特。95, 68003 (2011) ·doi:10.1209/0295-5075/95/68003
[63] Peña,J.,Rochat,Y.:二分图是进化多人游戏中人口结构的模型。公共科学图书馆ONE 7,e44514(2012)·doi:10.1371/journal.pone.0044514
[64] Traulsen,A.,Semmann,D.,Sommerfeld,R.D.,Krambeck,H.J.,Milinski,M.:进化博弈中的人类策略更新。程序。国家。阿卡德。科学。美国107,2962-2966(2010)·doi:10.1073/pnas.0912515107
[65] Semmann,D.:有条件的合作会阻碍网络互惠。程序。国家。阿卡德。科学。美国10912846-12847(2012)·doi:10.1073/pnas.1210294109
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。