文件Zbl 1414.91067-zbMATH Open

通过分布式学习选择有效的相关均衡。（英语） Zbl 1414.91067号

游戏经济。行为。 106, 114-133 (2017).

总结：如果每个玩家的行为只以他自己实现的收益为条件，而不需要知道其他人的行为或收益，那么学习规则就完全不耦合了。我们证明了一个简单的、完全解耦的学习规则，这样，在任何具有一般回报的有限范式博弈中，玩家实现的策略在很大程度上实现了社会最优的粗相关（Hannan）均衡。也就是说，与玩家集体行为相关的经验频率将与社会最优的粗相关均衡相一致。该规则的变体在很大程度上实现了社会最优相关均衡。

引用于2文件

MSC公司：

91A26型

博弈论中的理性与学习

关键词：

博弈论;学习;网络化控制

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	奥尔特曼，E。；北波诺。；Debbah，M.，无线通信接入控制中的相关均衡，（第五届国际网络会议（2006年））
[2]	阿里利，I。；Babichenko，Y.，《平均检验与有效边界》（2011），牛津大学和希伯来大学经济系，讨论文件
[3]	Borowski，H.P。；Marden，J.R。；Shamma，J.S.，《学习有效相关均衡》（IEEE决策与控制会议论文集（2014））
[4]	Foster，D。；Vohra，R.，《校准学习和相关均衡》，《游戏经济学》。行为。，21, 40-55 (1997) ·Zbl 0894.90188号
[5]	Foster，D。；Young，H.，随机进化博弈动力学，J.理论民粹。《生物学》，38，219-232（1990）·Zbl 0703.92015号
[6]	Foster，D。；Young，H.，后悔测试：在不知道对手的情况下学习纳什均衡，理论经济学。，1, 341-367 (2006)
[7]	福登堡，D。；莱文，D.，《游戏中的学习理论》（1998年），麻省理工学院出版社：麻省理学院出版社，马萨诸塞州剑桥·Zbl 0939.91004号
[8]	福登堡，D。；Maskin，E.，具有折扣或不完全信息的重复博弈中的民间定理，《计量经济学》，54，533-554（1986）·Zbl 0615.90099号
[9]	Germano，F。；Lugosi，G.，《Foster和Young后悔测试的全球纳什收敛》，《游戏经济》。行为。，60135-154（2007年7月）·Zbl 1155.91318号
[10]	哈特，S。；Mas-Colell，A.，《导致相关平衡的简单适应性程序》，《计量经济学》，68，5，1127-1150（2000）·Zbl 1020.91003号
[11]	哈特，S。；Mas-Colell，A.，非耦合动力学不会导致纳什均衡，Amer。经济。修订版，93，编号5，1830-1836（2003）
[12]	Ho，Y.C。；Sun，F.K.，双队零和问题中信息的价值，J.Optim。理论应用。，14557-571（1974年11月）·兹伯利0272.90094
[13]	Jiang，A.X。；Leyton-Brown，K.，紧对策中精确相关平衡的多项式时间计算，（第十二届ACM电子商务会议论文集。第十二届AC电子商务会议文献集，ACM-EC（2011））
[14]	Marden，J.R。；杨，H.P。；Arslan，G。；Shamma，J.S.，多层弱非循环游戏基于支付的动力学，SIAM J.Control Optim。，48373-396（2009年2月）·Zbl 1186.91033号
[15]	Marden，J.R。；Young，H.P。；Pao，L.Y.，通过分布式学习实现帕累托最优，SIAM J.Control Optim。，52, 5, 2753-2770 (2014) ·Zbl 1305.91045号
[16]	Papadimitriou，C.，《计算多人游戏中的相关平衡》（ACM计算理论年度研讨会论文集（2005））
[17]	Papadimitriou，C。；Roughgarden，T.，《计算多层游戏中的均衡》（ACM-SIAM离散算法研讨会论文集（2005））·Zbl 1297.91005号
[18]	Papadimitriou，C。；Roughgarden，T.，《计算多层游戏中的相关均衡》，J.ACM，55（2008）·Zbl 1314.91012号
[19]	普拉德尔斯基，B.R。；Young，H.P.，《分布式系统中学习有效的纳什均衡》，《游戏经济学》。行为。，75882-897（2012年7月）·Zbl 1239.91018号
[20]	王，B。；韩，Z。；Liu，K.，使用相关均衡的对等文件共享游戏，（第43届信息科学与系统年会，第43届资讯科学与系统年度会议，CISS 2009年3月（2009）），729-734
[21]	Young，H.P.，《公约的演变》，《计量经济学》，61，1，57-84（1993年1月）·Zbl 0773.90101号
[22]	Young，H.P.，《试错学习》，《游戏经济学》。行为。，65, 626-643 (2009) ·Zbl 1158.91327号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
右心室	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

通过分布式学习选择有效的相关均衡。（英语） Zbl 1414.91067号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

通过分布式学习选择有效的相关均衡。 （英语） Zbl 1414.91067号

MSC公司：

关键词：

参考文献：

通过分布式学习选择有效的相关均衡。（英语） Zbl 1414.91067号