×

通过分布式学习选择有效的相关均衡。 (英语) Zbl 1414.91067号

总结:如果每个玩家的行为只以他自己实现的收益为条件,而不需要知道其他人的行为或收益,那么学习规则就完全不耦合了。我们证明了一个简单的、完全解耦的学习规则,这样,在任何具有一般回报的有限范式博弈中,玩家实现的策略在很大程度上实现了社会最优的粗相关(Hannan)均衡。也就是说,与玩家集体行为相关的经验频率将与社会最优的粗相关均衡相一致。该规则的变体在很大程度上实现了社会最优相关均衡。

MSC公司:

91A26型 博弈论中的理性与学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥尔特曼,E。;北波诺。;Debbah,M.,无线通信接入控制中的相关均衡,(第五届国际网络会议(2006年))
[2] 阿里利,I。;Babichenko,Y.,《平均检验与有效边界》(2011),牛津大学和希伯来大学经济系,讨论文件
[3] Borowski,H.P。;Marden,J.R。;Shamma,J.S.,《学习有效相关均衡》(IEEE决策与控制会议论文集(2014))
[4] Foster,D。;Vohra,R.,《校准学习和相关均衡》,《游戏经济学》。行为。,21, 40-55 (1997) ·Zbl 0894.90188号
[5] Foster,D。;Young,H.,随机进化博弈动力学,J.理论民粹。《生物学》,38,219-232(1990)·Zbl 0703.92015号
[6] Foster,D。;Young,H.,后悔测试:在不知道对手的情况下学习纳什均衡,理论经济学。,1, 341-367 (2006)
[7] 福登堡,D。;莱文,D.,《游戏中的学习理论》(1998年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥·Zbl 0939.91004号
[8] 福登堡,D。;Maskin,E.,具有折扣或不完全信息的重复博弈中的民间定理,《计量经济学》,54,533-554(1986)·Zbl 0615.90099号
[9] Germano,F。;Lugosi,G.,《Foster和Young后悔测试的全球纳什收敛》,《游戏经济》。行为。,60135-154(2007年7月)·Zbl 1155.91318号
[10] 哈特,S。;Mas-Colell,A.,《导致相关平衡的简单适应性程序》,《计量经济学》,68,5,1127-1150(2000)·Zbl 1020.91003号
[11] 哈特,S。;Mas-Colell,A.,非耦合动力学不会导致纳什均衡,Amer。经济。修订版,93,编号5,1830-1836(2003)
[12] Ho,Y.C。;Sun,F.K.,双队零和问题中信息的价值,J.Optim。理论应用。,14557-571(1974年11月)·兹伯利0272.90094
[13] Jiang,A.X。;Leyton-Brown,K.,紧对策中精确相关平衡的多项式时间计算,(第十二届ACM电子商务会议论文集。第十二届AC电子商务会议文献集,ACM-EC(2011))
[14] Marden,J.R。;杨,H.P。;Arslan,G。;Shamma,J.S.,多层弱非循环游戏基于支付的动力学,SIAM J.Control Optim。,48373-396(2009年2月)·Zbl 1186.91033号
[15] Marden,J.R。;Young,H.P。;Pao,L.Y.,通过分布式学习实现帕累托最优,SIAM J.Control Optim。,52, 5, 2753-2770 (2014) ·Zbl 1305.91045号
[16] Papadimitriou,C.,《计算多人游戏中的相关平衡》(ACM计算理论年度研讨会论文集(2005))
[17] Papadimitriou,C。;Roughgarden,T.,《计算多层游戏中的均衡》(ACM-SIAM离散算法研讨会论文集(2005))·Zbl 1297.91005号
[18] Papadimitriou,C。;Roughgarden,T.,《计算多层游戏中的相关均衡》,J.ACM,55(2008)·Zbl 1314.91012号
[19] 普拉德尔斯基,B.R。;Young,H.P.,《分布式系统中学习有效的纳什均衡》,《游戏经济学》。行为。,75882-897(2012年7月)·Zbl 1239.91018号
[20] 王,B。;韩,Z。;Liu,K.,使用相关均衡的对等文件共享游戏,(第43届信息科学与系统年会,第43届资讯科学与系统年度会议,CISS 2009年3月(2009)),729-734
[21] Young,H.P.,《公约的演变》,《计量经济学》,61,1,57-84(1993年1月)·Zbl 0773.90101号
[22] Young,H.P.,《试错学习》,《游戏经济学》。行为。,65, 626-643 (2009) ·Zbl 1158.91327号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。