文件Zbl 1267.82155-zbMATH Open

叶甫盖尼亚·克里斯托福鲁;安东尼奥·费尔南德斯·安塔;克里斯西·乔治奥;米格尔·莫斯泰罗。;安杰尔·桑切斯

群体计算作为一个合作问题：进化方法。（英语） Zbl 1267.82155号

J.Stat.物理。 151，编号3-4，654-672（2013）.

摘要：合作是物理学界十分关注的社会经济问题之一。这个问题主要是通过研究囚徒困境或公共物品博弈来考虑的。在这里，我们通过研究群组计算环境下的合作向前迈出了一步。我们引入了一个松散地基于委托代理理论的模型，在该模型中，人们（工人）通过计算答案并向问题提出者（主）报告来为分布式问题的解决做出贡献。为了超越涉及纳什均衡概念的经典方法，我们研究了一个进化框架，在这个框架中，主人和工人都通过强化学习来更新他们的行为。使用马尔可夫链方法，我们从理论上表明，在某些条件下（不是非常严格的条件下），主控者可以确保过程结果的可靠性。然后，我们通过数值模拟研究了模型，发现收敛性，即系统达到一个总是能产生可靠答案的点，通常可能比理论计算给出的上限快得多。我们还讨论了硕士的容忍度对叛逃者的影响，而这一理论并未提供相关信息。讨论表明，即使在公差非常大的情况下，该系统也能正常工作。最后，我们讨论了我们的结果以及进一步开展这项研究的可能方向。

MSC公司：

82天99	统计力学在特定类型物理系统中的应用
68T42型	Agent技术与人工智能
91B69型	异构代理模型
82B20型	格系统（伊辛、二聚体、波茨等）和平衡统计力学中出现的图上系统
91B80型	统计和量子力学在经济学中的应用（经济物理学）
60J20型	马尔可夫链和离散时间马尔可夫过程在一般状态空间（社会流动、学习理论、工业过程等）上的应用

关键词：

进化博弈论;合作;马尔可夫链;群组计算;强化学习

软件：

BOINC公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

参考文献：

[1]	鲍尔，P.：《临界质量：一件事如何导致另一件事》。Arrow Books，伦敦（2005）
[2]	Mantegna，R.N.，Stanley，H.E.：《经济物理学导论：金融中的相关性和复杂性》。剑桥大学出版社，剑桥（1999）·Zbl 1138.91300号 ·doi:10.1017/CBO9780511755767
[3]	Castellano，C.，Fortunato，S.，Loreto，V.：社会动力学的统计物理学。修订版Mod。物理。81, 591-646 (2009) ·doi:10.1103/RevModPhys.81.591
[4]	P.W.安德森：更多是不同的。《科学》177，393-396（1972）·doi:10.1126/science.177.4047.393
[5]	Goldenfeld，N.：关于相变和重整化群的讲座。Addison-Wesley，波士顿（1992）·Zbl 0825.76872号
[6]	谢林，T.C.：微观动机和宏观行为。诺顿，纽约（1978）
[7]	Stauffer，D.、Solomon，S.：伊辛、谢林和自组织隔离。欧洲物理学。J.B 57，473-479（2007）·doi:10.1140/epjb/e2007-00181-8
[8]	Stigler，G.J.：效用理论的发展：I，II。政治经济学杂志。58, 307-327, 373-396 (1950). ·doi:10.1086/256962
[9]	Goffman，E.：战略互动。宾夕法尼亚大学出版社，费城（1969年）
[10]	von Neumann，J.，Morgenstern，O.：博弈论与经济行为。普林斯顿大学出版社，普林斯顿（1944）·Zbl 0063.05930号
[11]	梅纳德·史密斯，J.：《进化论与博弈论》。剑桥大学出版社，纽约/伦敦（1982）·Zbl 0526.90102号 ·doi:10.1017/CBO9780511806292
[12]	Gintis，H.：《理性的边界：博弈论和行为科学的统一》。普林斯顿大学出版社，普林斯顿（2009）·Zbl 1168.91006号
[13]	Vega-Redondo，F.：博弈论和经济应用。剑桥大学出版社，剑桥（2003）·Zbl 1041.65001号 ·doi:10.1017/CBO9780511753954
[14]	Gintis，H.：《博弈论进化》，第二版。普林斯顿大学出版社，普林斯顿（2009）·Zbl 1161.91005号
[15]	纳什，J.：n人博弈中的平衡点。程序。国家。阿卡德。科学。美国36，48-49（1950）·Zbl 0036.01104号 ·doi:10.1073/pnas.36.1.48
[16]	霍夫鲍尔，J.，西格蒙德，K.：进化博弈与人口动力学。剑桥大学出版社，剑桥（1988）·Zbl 0914.90287号
[17]	霍夫鲍尔，J.，西格蒙德，K.：进化博弈动力学。牛市。美国数学。Soc.40，479-519（2003）·Zbl 1049.91025号 ·doi:10.1090/S0273-0979-03-00988-1
[18]	Nowak，M.A.：进化动力学。哈佛大学出版社，哈佛（2006）·Zbl 1115.92047号
[19]	Taylor，P.，Jonker，L.：进化稳定策略和博弈动力学。数学。Biosci公司。40, 45-156 (1978) ·Zbl 0395.90118号 ·doi:10.1016/0025-5564（78）90077-9
[20]	达尔文，C.：《人类的后裔与性别选择》。伦敦默里（1871）·doi:10.1037/12294-000
[21]	Kollock，P.：《社会困境：合作的剖析》。每年。社会学评论。24, 183-214 (1998) ·doi:10.1146/annurev.soc.24.1.183
[22]	Nowak，M.A.：合作进化的五条规则。科学3141560-1563（2006）·doi:10.1126/science.1133755
[23]	Roca，C.P.，Cuesta，J.A.，Sánchez，A.：进化博弈论：超越复制动力的时空效应。物理。Life修订版6208-249（2009）·doi:10.1016/j.plrev.2009.08.001
[24]	Grujić，J.，Fosco，C.，Araújo，L.，Cuesta，J.A.，Sánchez，A.：中尺度的社会实验：人类扮演空间囚徒困境。《公共科学图书馆·综合》5，e13749（2010）·doi:10.1371/journal.pone.0013749
[25]	Gracia-Lázaro，C.，Ferrer，A.，Ruiz，G.，Tarancón，A.，Cuesta，J.A.，Sánchez，A.，Moreno，Y.：当人类陷入囚犯困境时，异质网络不会促进合作。程序。国家。阿卡德。科学。美国10912922-12926（2012）·doi:10.1073/pnas.1206681109
[26]	Szabó，G.，Fáth，G.：图上的进化博弈。物理。代表446、97-216（2007）·doi:10.1016/j.physrep.2007.04.004
[27]	Perc，M.，Szolnoki，A.：共同进化游戏——迷你评论。生物系统99，109-125（2010）·doi:10.1016/j.biosystems.2009.10.003
[28]	Rees，R.：委托人与代理人理论：I，II。牛市。经济。第37号决议，3-26（1985年）。75-97 ·doi:10.1111/j.1467-8586.1985.tb00179.x
[29]	Mass-Colell，A.，Whinton，M.，Green，J.：微观经济理论。牛津大学出版社，牛津（1995）·Zbl 1256.91002号
[30]	Anderson，D.，BOINC：公共资源计算和存储系统，4-10（2004）
[31]	Korpela，E.，Werthimer，D.，Anderson，D.，Cobb，J.，Lebofsky，M.：SETI@主页：SETI的大规模分布式计算。计算。科学。工程3，78-83（2001）·doi:10.1109/5992.895191
[32]	Ibercivis公民计算平台。网址：http://www.ibercivis.net
[33]	亚马逊的机械突厥。https://www.mturk.com
[34]	Babaioff，M.、Feldman，M.和Nisan，N.：组合代理。载于：《2006年美国机械工程师协会会议记录》，第18-28页（2006年）·Zbl 1258.91082号
[35]	Babaioff，M。；费尔德曼，M。；Nisan，N.，《组合代理中的混合策略》，353-364（2006）·Zbl 1210.68119号
[36]	Babaioff，M。；费尔德曼，M。；Nisan，N.，《组合代理中的搭便车和免费劳动》，109-121（2009）·Zbl 1262.91102号
[37]	艾登本兹，R。；Schmid，S.，联合审计机构，374-383（2009）
[38]	戈尔，P。；Mironov，I.，《不可加热分布式计算》，425-440（2001）·Zbl 0972.68077号
[39]	Heien，E.M.，Anderson，D.P.，Hagihara，K.：在志愿者计算环境中使用不可靠的工人计算低延迟批次。J.网格计算。7, 501-518 (2009) ·doi:10.1007/s10723-009-9131-6
[40]	施奈德曼，J。；Parkes，D.C.，《P2P网络中的理性与自利》，139-148（2003）
[41]	亚伯拉罕一世。；多列夫，D。；戈登，R。；Halpern，J.Y.，《分布式计算与博弈论：理性秘密共享和多方计算的稳健机制》，53-62（2006）·Zbl 1314.68051号
[42]	Sarmenta，L.：志愿计算系统的破坏容忍机制。未来一代。计算。系统。18, 561-572 (2002) ·Zbl 1032.68015号 ·doi:10.1016/S0167-739X（01）00077-2
[43]	费尔南德斯·安塔，A。；Ch.乔治奥。；Mosteiro，M.A.，《基于互联网的可靠计算的设计机制》，315-324（2008）
[44]	Fernández Anta，A.，Georgiou，Ch.，Mosteiro，M.A.：基于互联网的主从计算的算法机制，与不信任和自私的工作者一起使用。摘自：2010年IPDPS会议记录，第1-11页（2010年）
[45]	博伊德·R、理查德森·P·J：惩罚允许在大规模群体中发展合作（或任何其他）。乙醇。社会生物学。13, 171-195 (1992) ·doi:10.1016/0162-3095（92）90032-Y
[46]	Fehr，E.，Gächter，S.：人类的利他惩罚。《自然》415137-140（2002）·doi:10.1038/415137a
[47]	Rose，D.，Willemain，T.R.：进化学习的委托代理问题。计算。数学。器官。理论2，139-162（1996）·兹伯利0873.90148 ·doi:10.1007/BF00240424
[48]	Bush，R.R.，Mosteller，F.：学习的随机模型。威利，纽约（1955年）·兹比尔0064.39002
[49]	克罗斯，F.G.：适应性经济行为理论。剑桥大学出版社，剑桥（1983）·文件编号：10.1017/CBO9780511983856
[50]	Erev，I.，Roth，A.：《预测人们如何玩游戏：在具有独特混合策略均衡的实验游戏中强化学习》，《美国经济》。版本88，848-881（1998）
[51]	卡梅勒，C.F.：行为博弈论：战略互动实验。普林斯顿大学出版社，普林斯顿（2003）·Zbl 1019.91001号
[52]	达菲，J。；Tesfatsion，L.（编辑）；Judd，K.L.（编辑），基于代理的模型和人体实验，949-1011（2006），阿姆斯特丹
[53]	梅西，M.W.，弗拉奇，A.：社会困境中的学习动力。程序。国家。阿卡德。科学。美国99，7229-7236（2002）·Zbl 1355.91014号 ·doi:10.1073/pnas.092080099
[54]	Izquierdo，S.S.、Izquierto，L.R.、Gotts，N.M.：社会困境中的强化学习动力。J.阿蒂夫。Soc.Soc.模拟。11, 1 (2008)
[55]	Izquierdo，L.R。；Izquierdo，S.S。；韦伯，C.（编辑）；Elshaw，M.（编辑）；Mayer，N.M.（编辑），《2×2游戏中Bush-Mosteller学习算法的动力学》（2008），维也纳
[56]	克里斯托弗鲁，E。；费尔南德斯·安塔，A。；乔治奥，C。；Mosteiro，医学硕士。；Sánchez，A.，《通过进化动力学实现主从计算的可靠性》（2012）·Zbl 1301.68055号
[57]	Szepesvári，C.：强化学习算法。Morgan&Claypool，San Rafael（2010年）·Zbl 1205.68320号
[58]	Szolnoki，A.，Perc，M.，Szabó，G.：噪声对空间公共物品游戏中合作的拓扑无关影响。物理。版本E 80，056109（2009）·doi:10.1103/PhysRevE.80.056109
[59]	Szolnoki，A.，Perc，M.：群体规模对空间公共产品博弈中合作演变的影响。物理。版本E 84，047102（2011）·doi:10.1103/PhysRevE.84.047102
[60]	Perc，M.：强烈的异质性会通过群体互动促进合作吗？新J.Phys。2011年12月13日·doi:10.1088/1367-2630/13/12/23027
[61]	Gómez-Gardeñes，J.，Romance，M.，Criado，R.，Vilone，D.，Sánchez，A.：网络中尺度下定义的进化博弈：公共物品博弈。混沌21，016113（2011）·Zbl 1345.91002号 ·doi:10.1063/1.3535579
[62]	Gómez-Gardeñes，J.，Vilone，D.，Sánchez，A.：消除社会和群体异质性：复杂网络上的公共物品游戏。欧洲鱼。莱特。95, 68003 (2011) ·doi:10.1209/0295-5075/95/68003
[63]	Peña，J.，Rochat，Y.：二分图是进化多人游戏中人口结构的模型。公共科学图书馆ONE 7，e44514（2012）·doi:10.1371/journal.pone.0044514
[64]	Traulsen，A.，Semmann，D.，Sommerfeld，R.D.，Krambeck，H.J.，Milinski，M.：进化博弈中的人类策略更新。程序。国家。阿卡德。科学。美国107，2962-2966（2010）·doi:10.1073/pnas.0912515107
[65]	Semmann，D.：有条件的合作会阻碍网络互惠。程序。国家。阿卡德。科学。美国10912846-12847（2012）·doi:10.1073/pnas.1210294109

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

群体计算作为一个合作问题：进化方法。（英语） Zbl 1267.82155号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

群体计算作为一个合作问题：进化方法。 （英语） Zbl 1267.82155号

MSC公司：

关键词：

软件：

参考文献：

群体计算作为一个合作问题：进化方法。（英语） Zbl 1267.82155号