×

使用自利的部分理性代理有效解决死锁。 (英语) Zbl 1319.68221号

摘要:本文涉及由自利有界国家自治代理填充的环境中的分布式死锁解决。特别是它报告了66个代理的广泛实验结果,每个代理都使用由不同的人类决策者在整个实验过程中开发和维护的死锁解决策略。虽然从博弈论的角度来看,可以为这个问题设计一个简单的基于均衡的解决方案,但事实表明,这种解决方案对于有界的国家代理人来说是不成立的,即使它的原理已经向维护代理人策略的个人彻底解释过了。相反,我们表明系统收敛到一个稳态,在该稳态中,代理使用一组丰富的不同策略,性能不同,因为每个代理都基于其他代理的行为对其改进能力有不同的信念。为了提高系统性能,我们开发并实现了一种重组启发式算法,它可以更改每个代理接收的输入,从而影响代理的决策,以更好地与所需的解决方案保持一致。呈现给每个代理的重新构造的死锁基于它以前遇到的死锁。我们的实验证明了重组启发式在促进新的稳态方面的有效性,在该稳态中,系统整体上大大提高了其性能。通过与输入重组的神经网络实现进行比较,从有效重组代理输入所需的一组先前经验的大小来看,该方法的效率得到了证明,显示了重组启发式的实质性优势。

MSC公司:

68T42型 Agent技术与人工智能
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abreu,D.,Rubinstein,A.:有限自动机重复博弈中的纳什均衡结构。《计量经济学》56(6),1259-1281(1988)·Zbl 0664.90103号 ·数字对象标识代码:10.2307/1913097
[2] Agrawal,R.,Carey,M.,Mcvoy,L.:处理数据库管理系统中死锁的替代策略的性能。IEEE传输。柔和。工程13(12),1348-1363(1987)·doi:10.1109/TSE.1987.233145
[3] Auer,P.,Bianchi,N.,Fischer,P.:多武装匪徒问题的有限时间分析。机器。学习。47(2-3), 235-256 (2002) ·Zbl 1012.68093号 ·doi:10.1023/A:1013689704352
[4] Azaria,A.,Rabinovich,Z.,Kraus,S.,Goldman,C.:向具有多种选择的人披露战略信息。摘自:AAAI会议记录,第594-600页(2011年)
[5] Azoulay-Schwartz,R.,Kraus,S.,Wilkenfeld,J.:开发与探索:在信息不完整的环境中选择供应商。国际期刊Decis。支持。系统。电子。商业。38(1), 1-18 (2004) ·doi:10.1016/S0167-9236(03)00061-7
[6] Bensalem,S.、Fernandez,J.、Havelund,K.:通过运行时分析检测到的死锁可能性的确认。摘自:PADTAD会议记录,第41-50页(2006年)
[7] Bo,P.,Frechette,G.:无限重复游戏中合作的演变:实验证据。美国经济。版本101(1),411-429(2011)·doi:10.1257/aer.101.1.411
[8] Chalamish,M.,Sarne,D.,Kraus,S.:将编程代理作为捕获自我策略的手段。摘自:AAMAS会议记录,第1161-1168页(2008年)·Zbl 1225.91017号
[9] Chalamish,M.、Sarne,D.、Lin,R.:使用对等设计代理增强停车模拟。IEEE传输。智力。运输。系统。13(4), 1-7 (2012) ·doi:10.1109/TITS.2012.2228136
[10] Chandy,K.、Misra,J.、Haas,L.:分布式死锁检测。ACM事务处理。计算。系统。1(2), 144-156 (1983) ·doi:10.1145/357360.357365
[11] 查韦斯,A.,卡斯巴,P.梅斯:《买卖货物的代理市场:PAAM议事录》,第75-90页(1996年)
[12] Coffman,E.,Elphick,M.,Shoshani,A.:系统死锁。ACM计算。Surv公司。3(2), 67-78 (1971) ·兹比尔0226.68015 ·数字对象标识代码:10.1145/356586.356588
[13] Cybeko,G.:通过sigmoid函数的叠加进行逼近。数学。控制信号系统。5(4), 455-455 (1992) ·Zbl 0771.94017号 ·doi:10.1007/BF02134016
[14] Cysneiros,L.,Yu,E.:大型多智能体系统的需求工程。载:《大规模多代理系统软件工程论文集》,第39-56页(2002年)·Zbl 1019.68665号
[15] Duffy,J.,Hopkins,E.:市场进入游戏中的学习、信息和分类:理论和证据。ESE讨论文件78。爱丁堡大学(2004)·Zbl 0996.68004号
[16] Elmalech,A.,Sarne,D.:评估对等设计代理在机制评估中的适用性。In:IAT会议记录(2012)
[17] Elmaliach,Y.,Kaminka,G.:人类监督和控制下的强大多机器人编队。《物理学杂志》。代理人2(1),31(2008)
[18] Endriss,U.:多边谈判的单调让步协议。摘自:AAMAS会议记录,第392-399页(2006年)
[19] Erez,I.,Roth,A.:预测人们如何玩游戏:在具有独特混合策略均衡的实验游戏中强化学习。《美国经济》。修订版88(4),848-881(1998)
[20] Ferrari,S.:使用神经网络的平滑函数近似。IEEE传输。神经网络。16(1),24-38(2005)·doi:10.1109/TNN.2004.836233
[21] Gasser,M.、Goldstein,A.、Kaufman,C.、Lampon,B.:数字分布式系统安全架构。摘自:《国家计算机安全会议论文集》,305-319(1989)·Zbl 0664.90103号
[22] Gmytrasiewicz,P.,Durfee,E.:多智能体环境中的理性协调。J.汽车。代理人。多代理系统。2(4), 319-350 (2000) ·doi:10.1023/A:101028119149
[23] Grosz,B.、Kraus,S.、Talman,S.,Stossel,B.、Havlin,M.:社会依赖对决策的影响:新游戏的初步调查。摘自:AAMAS会议记录,第780-787页(2004年)·Zbl 1012.68093号
[24] Hadad,M.,Kraus,S.,Hartman,I.B.-A.,Rosenfeld,A.:有时间限制的团队规划。安。数学。Artif公司。智力。,1-49 (2013) ·Zbl 1357.68246号
[25] Hajaj,C.,Hazon,N.,Sarne,D.,Elmalech,A.:多搜索,少披露。第二十七届AAAI人工智能会议论文集(2013)
[26] Hazon,N.,Lin,R.,Kraus,S.:如何改变集团的集体决策?摘自:《第二十届国际人工智能联合会议论文集》,IJCAI'13,第198-205页。AAAI出版社(2013)
[27] 平山,K.,丰田章男,J.:组成联盟打破僵局。摘自:AAAI会议记录,第155-162页(1995年)·兹比尔0226.68015
[28] Hornick,M.,Zdonik,S.:面向对象数据库的共享分段内存系统。ACM事务处理。信息系统。5(1), 70-95 (1987) ·doi:10.1145/22890.22891
[29] http://neuroph.sourceforge.net
[30] Isloor,S.,Marsland,T.:僵局问题:概述。IEEE计算。13(9), 58-78 (1980) ·doi:10.1109/MC.1980.1653786
[31] Iyengar,S.:选择的艺术。十二(2010)
[32] Jager,M.,Nebel,B.:多移动机器人的分散碰撞避免、死锁检测和死锁解决。摘自:IEEE智能机器人和系统会议记录,第1213-1219页(2001)
[33] Kahneman,D.,Tversky,A.:选择、价值观和框架。剑桥大学出版社(2000)·Zbl 1225.91017号
[34] Kaveh,N.,Emmerich,W.:分布式对象系统中的死锁检测。载于:ACM SIGSOFT软件工程基础研讨会论文集,第44-51页(2001)
[35] Kshemkalyani,A.,Singhal,M.:广义分布式死锁的有效检测和解决。IEEE传输。柔和。工程20(1),43-54(1994)·数字对象标识代码:10.1109/32.263754
[36] Lee,S.:在广义模型中快速、集中地检测和解决分布式死锁。IEEE传输。柔和。工程30(9),561-573(2004)·doi:10.1109/TSE.2004.51
[37] Li,P.,Agrawal,K.,Buhler,J.,Chamberlain,R.,Lancaster,J.:分流连接结构流应用程序的死锁避免:两个案例研究。摘自:IEEE应用特定系统架构和处理器会议记录,第333-336页(2010年)·Zbl 0226.68015号
[38] Lin,R.,Kraus,S.,Oshrat,Y.,Gal,Y.:使用对等设计的代理促进自动谈判人员的评估。摘自:AAAI会议记录,第817-822页(2010年)
[39] 马拉斯:人们玩纳什均衡吗?进化博弈论的教训。《经济学杂志》。点燃。36(3), 1347-1374 (1998)
[40] Manisterski,E.,Lin,R.,Kraus,S.:了解人们如何随着时间的推移设计交易代理。摘自:AAMAS会议记录,第1593-1596页(2008年)
[41] Mitchell,D.,Merritt,M.:死锁检测和解决的分布式算法。摘自:ACM分布式计算原理研讨会论文集,第282-284页(1984)
[42] Mohan,C.,Lindsay,B.,Obermarck,R.:R*分布式数据库管理系统中的事务管理。ACM事务处理。数据库系统。11(4), 378-396 (1986) ·doi:10.1145/7239.7266
[43] Narendra,K.:使用神经网络和近似模型的自适应控制。IEEE传输。神经网络。8(3), 475-485 (1997) ·数字对象标识代码:10.1109/72.572089
[44] Nguyen,T.,Roos,M.,Rothe,J.:关于多主体资源分配中社会福利优化的近似性和不近似性结果的调查。安。数学。Artif公司。智力。,1-26 (2013) ·Zbl 1286.68205号
[45] Parameswaran,M.,Rui,H.,Sayin,S.:垃圾邮件发送者策略的博弈模型和实证分析。参与:《协作、电子信息、反滥用和垃圾邮件》(2010年)·Zbl 0664.90103号
[46] 拉宾,M.:心理学和经济学。《经济学杂志》。点燃。36(1), 11-46 (1998)
[47] Roesler,M.,Burkhard,W.:面向对象分布式系统中死锁的解决。IEEE传输。计算。38(8), 1212-1224 (1989) ·数字对象标识代码:10.1109/12.30874
[48] Rosenfeld,A.,Kraus,S.:通过有限理性理论对代理人进行建模。收录于:IJCAI会议记录,第264-271页(2009年)
[49] Rosenfeld,A.,Kraus,S.:基于愿望适应理论的代理建模。J.汽车。代理人。多代理系统。24(2), 221-254 (2012) ·数字对象标识代码:10.1007/s10458-010-9158-x
[50] Sarne,D.,Elmalech,A.,Grosz,B.,Geva,M.:少即是多:重组决策以改进代理搜索。摘自:AAMAS会议记录,第431-438页(2011年)
[51] Selvaraj,S.,Ramasamy,R.:分布式系统中广义死锁的有效检测和解决。国际期刊计算。申请。1(1), 1-7 (2010) ·doi:10.4018/jaec.2010010101
[52] Silberschatz,A.,Gagne,G.,Galvin,P.,第8版:操作系统概念。威利(2008)
[53] 西蒙,A。;McGuire,C.B(编辑);Radner,R.(编辑),《有限理性理论》(1972年),北荷兰
[54] Sofy,N.,Sarne,D.:关于分布式死锁解决的博弈论方法的失败。摘自:AAMAS会议记录,第1445-1446页(2012年)
[55] Srinivasan,S.,Rajaram,R.:分布式系统中广义模型的分散死锁检测和解决算法。分布式并行数据库29(4),261-276(2011)·doi:10.1007/s10619-011-7078-7
[56] Stirling,W.,Goodrich,M.,Packard,D.:满足均衡:博弈和决策的非经典理论。J.汽车。代理人。多代理系统。5(3), 305-328 (2002) ·doi:10.1023/A:1015556407380
[57] Sujit,P.,Sinha,A.,Ghose,D.:使用协商进行多无人机任务分配。摘自:AAMAS会议记录,第471-478页(2006年)
[58] Thaler,R.,Sunstein,C.:微移:改善关于健康、财富和幸福的决策。耶鲁大学出版社(2008)
[59] Tversky,A.,Kahneman,D.:决策框架和选择心理。科学。211(4481), 453-458 (1981) ·Zbl 1225.91017号 ·doi:10.1126/science.7455683
[60] Vermorel,J.,Mohri,M.:多武器强盗算法和经验评估。载:《欧洲机器学习会议记录》,第437-448页(2005年)
[61] Werbos,P.:通过时间的反向传播:它做什么和如何做。IEEE 78(10),1550-1560(1990)·数字对象标识代码:10.1109/5.58337
[62] Weyns,D.,Boucke,N.,Holvoet,T.:自适应任务分配的基于现场的方法与基于协议的方法。J.汽车。代理人。多代理系统。17(2), 288-319 (2008) ·doi:10.1007/s10458-008-9037-x
[63] Wijngaards,N.、Overeinder,B.、Steen,M.V.、Brazier,F.:支持互联网规模的多代理系统。数据知识。工程41,229-245(2002)·Zbl 0996.68004号 ·doi:10.1016/S0169-023X(02)00042-3
[64] Wright,J.,Brown,K.:超越平衡:预测正常形态游戏中的人类行为。在:AAAI议事录,第901-907页(2010年)
[65] Yu,E.:进化和信息决策代理。在:代理人会议记录,第449-456页(2001年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。