×

图上聚合游戏的分布式算法。 (英语) Zbl 1348.91074号

摘要:我们考虑一类纳什博弈,称为聚合博弈,在网络系统上进行。在聚合游戏中,玩家的目标是所有玩家决策的聚合函数。每个参与者都保持对这个集合的估计,并且参与者通过连接的网络与本地邻居交换这个信息。我们研究了在这样的网络上进行信息交换和平衡计算的分布式同步和异步算法。在标准条件下,我们建立了所得序列到平衡点的几乎肯定收敛性。我们还考虑将我们的方案扩展到聚合游戏,其中玩家的目标通过更一般形式的聚合函数耦合。最后,我们给出了数值结果,证明了所提方案的性能。

MSC公司:

91A43型 涉及图形的游戏
91A10号 非合作游戏
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alos-Ferrer C,Ania AB(2005)完全竞争行为的进化稳定性。经济。理论26(3):497-516. 交叉参考·Zbl 1106.91002号
[2] Alpcan T,Bašar T(2002)一般拓扑网络中拥塞控制的游戏理论框架。程序。第41届IEEE会议决策与控制, 1218-1224. 交叉参考
[3] Alpcan T,Bašar T(2003)流量控制游戏纳什均衡的分布式算法。动态游戏的进展《国际动态游戏协会年鉴》,第7卷(波士顿Birkhäuser出版社),第473-498页。
[4] Bašar T(2007)通信网络的控制和游戏理论工具。申请。计算数学。6(2):104-125. ·Zbl 1209.90079号
[5] Bianchi P,Jakubowicz J(2013)非凸优化多智能体投影随机梯度算法的收敛性。IEEE传输。自动控制58(2):391-405. 交叉参考·Zbl 1369.90131号
[6] Boche H、Wiczanowski M、Stanczak S(2007)《关于最小最大公平、最大最小公平和细胞内网络效用优化的统一观点》。EURASIP J.无线通信。网络(1) :1-20·Zbl 1275.94009号
[7] Boyd S、Ghosh A、Prabhakar B、Shah D(2006)《随机八卦算法》。IEEE传输。通知。理论52(6):2508-2530. 交叉参考·Zbl 1283.94005号
[8] 古诺A(1838)《富豪理论数学》(Recherches sur les principles mathematiques de la theorie des richesses)(L.Hachette,巴黎)。
[9] Dubey P、Haimanko O、Zapechelnyuk A(2006)《战略互补和替代品以及潜在游戏》。游戏经济。行为。54(1):77-94. 交叉参考·兹比尔1129.91004
[10] 达德利·R(2002)实分析与概率(英国剑桥大学出版社)。交叉参考
[11] Facchini F,Pang JS(2003)有限维变分不等式与互补问题,卷。I和II(Springer-Verlag,纽约)。
[12] Facchinei F,Pang JS(2009)纳什均衡:变分方法。Palomar DP,Eldar YC,编辑。信号处理与通信中的凸优化(英国剑桥大学出版社),443-493。交叉参考·Zbl 1210.91008号
[13] Fudenberg D,Levine DK(1998年)游戏学习理论《麻省理工学院关于经济学习和社会进化的新闻系列》,第2卷(麻省理学院出版社,马萨诸塞州剑桥)。
[14] Fudenberg D,Tirole J(1991)博弈论(麻省理工学院出版社,马萨诸塞州剑桥)。
[15] Huang M,Caines PE,MalhaméRP(2007)《非均匀代理人的大群体成本耦合LQG问题:个体-群体行为和分散{\(\ε\)}-纳什均衡。IEEE传输。自动控制52(9):1560-1571. 交叉参考·Zbl 1366.91016号
[16] Jensen M(2006)《聚合游戏》。讨论文件06-10,伯明翰大学经济系。
[17] Jensen M(2010)《聚合游戏和最佳回复潜力》。经济。理论43(1):45-66. 交叉参考·Zbl 1185.91053号
[18] Johansson B(2008)《网络系统中的分布式优化》。斯德哥尔摩皇家理工学院博士论文。
[19] Johansson B,Rabi M,JohanssonM(2009)网络系统分布式优化的随机增量次梯度方法。SIAM J.Optim公司。20(3):1157-1170。交叉参考·Zbl 1201.65100号
[20] Juditsky A,Nemirovski A,Tauvel C(2011)用随机镜像算法求解变分不等式。随机系统1(1): 17-58. 交叉参考·Zbl 1291.49006号
[21] Kannan A,Shanbhag UV(2010)单调Nash博弈的分布式迭代正则化算法。程序。IEEE Conf.决策和控制(IEEE,新泽西州皮斯卡塔韦),1963-1968年。交叉参考
[22] Kannan A,Shanbhag UV(2012)通过迭代正则化技术对单调Nash博弈中的均衡进行分布式计算。SIAM J.Optim公司。22(4):1177-1205。交叉参考·Zbl 1281.90072号
[23] Koshal J,NedićA,Shanbhag UV(2010)不确定性下单调Nash博弈的单时间尺度正则化随机逼近方案。程序。IEEE Conf.决策和控制(IEEE,新泽西州皮斯卡塔韦),231-236。交叉参考
[24] Koshal J,NedićA,Shanbhag UV(2013)随机变分不等式问题的正则化迭代随机逼近方法。IEEE传输。自动控制58(3):594-609. 交叉参考·兹伯利1369.49012
[25] Li N,Marden JR(2013)《为分布式优化设计游戏》。J.信号处理专题7(2):230-242. 交叉参考
[26] Lobel I,Ozdaglar AE(2011)随机网络凸优化的分布式次梯度方法。IEEE传输。自动控制56(6):1291-1306. 交叉参考·Zbl 1368.90125号
[27] Marden JR、Ruben SD、Pao LY(2013)使用博弈论方法进行风电场控制的无模型方法。IEEE传输。控制系统技术。21(4):1207-1214. 交叉参考
[28] Martimort D,Stole L(2011)聚合游戏的聚合表示。MPRA论文32871,德国慕尼黑大学图书馆·Zbl 1250.91060号
[29] Moallemi C,Van Roy B(2006)《共识传播》。通知。理论,IEEE Trans。52(11):4753-4766. 交叉参考·Zbl 1323.94067号
[30] Moallemi C,Van Roy B(2010)凸优化中最小和消息传递的收敛性。通知。理论,IEEE Trans。56(4):2041-2050. 交叉参考·Zbl 1366.90162号
[31] 蒙德勒·D、沙普利·L(1996)《潜在游戏》。游戏经济。行为。14(1):124-143。交叉参考·Zbl 0862.90137号
[32] Nash JF Jr(1950)平衡点n个-个人游戏。程序。美国国家科学院。科学。36(1):48-49. 交叉参考
[33] NedićA(2011)基于网络的异步广播凸优化。IEEE传输。自动控制56(6):1337-1351. 交叉参考·Zbl 1368.90126号
[34] NedićA,Ozdaglar AE(2009),多智能体优化的分布式次梯度方法。IEEE传输。自动控制54(1):48-61. 交叉参考·Zbl 1367.90086号
[35] NedićA,Ozdaglar AE,Parrilo PA(2010),多智能体网络中的约束共识和优化。IEEE传输。自动控制55(4):922-938。交叉参考·Zbl 1368.90143号
[36] NedićA、Olshevsky A、Ozdaglar A、Tsitsiklis J(2008)《分布式平均算法和量化效果》。程序。第47届IEEE会议决策与控制, 4825-4830. 交叉参考·Zbl 1367.93405号
[37] Novshek W(1985)关于古诺均衡的存在性。经济评论。螺柱。52(1):85-98. 交叉参考·Zbl 0547.90011号
[38] Okuguchi K,Szidarovszky F(1990年)多产品企业寡头垄断理论《经济学和数学系统课堂讲稿》,第342卷(柏林施普林格-弗拉格出版社)。交叉参考·Zbl 0704.90001号
[39] Pan Y,Pavel L(2009)多链路拓扑光网络中耦合传播约束的游戏。Automatica公司45(4):871-880. 交叉参考·Zbl 1162.91326号
[40] Pan Y,Alpcan T,Pavel L(2010)光网络中OSNR优化的系统性能方法。IEEE传输。通信。58(4): 1193-1200. 交叉参考
[41] Papadimitriou CH,Yannakakis M(1994)关于有限理性和计算复杂性。印第安纳大学技术报告·Zbl 1345.68216号
[42] Pavel L(2006)光网络中OSNR优化的非合作博弈方法。IEEE传输。自动控制51(5):848-852. 交叉参考·Zbl 1366.91010号
[43] Pavel L(2007)将二元性扩展到游戏理论框架。Automatica公司43(2):226-237. 交叉参考·Zbl 1115.93005号
[44] 波利亚克B(1987)优化简介(Optimization Software,Inc.,纽约)。
[45] Ram S,NedićA,Veeravalli V(2009)《随机优化的异步八卦算法》。程序。第48届IEEE会议决策与控制(IEEE,新泽西州皮斯卡塔韦),3581-3586。
[46] Ram S,NedićA,Veeravalli V(2010a)《随机优化的异步八卦算法:恒定步长分析》。Diehl M、Glineur F、Jarlebring E、Michiels W编辑。最优化及其工程应用的最新进展第14届比利时-法国-德国优化会议(柏林施普林格),51-60。交叉参考
[47] Ram S,NedićA,Veeravalli V(2010b)凸优化的分布式随机次梯度投影算法。J.优化。理论应用。147(3):516-545. 交叉参考·Zbl 1254.90171号
[48] Ram S,NedićA,Veeravalli V(2012)一类新的分布式优化算法:在分布式数据回归中的应用。最佳方案。方法和软件27(1):71-88. 交叉参考·Zbl 1266.90142号
[49] Rantzer A(2008)《将博弈论用于分布式控制工程》,瑞典隆德大学自动控制系技术报告。
[50] Rantzer A(2009)分布式控制的动态双重分解。程序。阿默尔。控制配置。(IEEE,新泽西州皮斯卡塔韦),884-888。交叉参考
[51] Scutari G,Pang JS(2013)非凸认知无线电游戏中的联合感知和功率分配:纳什均衡和分布式算法。IEEE传输。通知。理论59(7):4626-4661. 交叉参考·Zbl 1364.91040号
[52] 西蒙·HA(1996)人工科学第3版(麻省理工学院出版社,马萨诸塞州剑桥)。
[53] Srivastava K,NedićA(2011)分布式异步约束随机优化。IEEE J.信号处理精选主题5(4):772-790. 交叉参考
[54] Srivastava K,NedićA,StipanovićD(2013)用于最小最大优化的分布式Bregman距离算法。基于代理的优化Springer计算智能研究(柏林Springer),143-174。交叉参考
[55] Stefanovic N,Pavel L(2011)光学链路中基于博弈论的功率控制的Lyapunov-Krasovskii稳定性分析。电信。系统47(1-2):19-33. 交叉参考
[56] Tsitsiklis J(1984)分散决策和计算中的问题。麻省理工学院博士论文,马萨诸塞州剑桥。
[57] Tu SY,Sayed AH(2012),扩散策略优于自适应网络上分布式估计的一致性策略。IEEE传输。信号处理60(12):6217-6234. 交叉参考·Zbl 1393.94465号
[58] Tu SY,Sayed AH(2013),《知情代理人对网络学习和适应的影响》。IEEE传输。信号处理61(6):1339-1356. 交叉参考·兹比尔1395.91379
[59] Yin H,Shanbhag UV,Mehta PG(2009)具有拥堵成本和共享约束的纳什均衡问题。程序。IEEE Conf.决策和控制4649-4654. 交叉参考
[60] Yin H,Shanbhag UV,Mehta PG(2011)具有规模拥堵成本和共享约束的纳什均衡问题。IEEE传输。自动控制56(7):1702-1708. 交叉参考·Zbl 1368.91011号
[61] Yin H,Mehta PG,Meyn SP,Shanbhag UV(2012)耦合振荡器的同步是一个游戏。IEEE传输。自动控制57(4):920-935. 交叉参考·兹伯利1369.34056
[62] Yousefian F,NedićA,Shanbhag UV(2013)随机变分不等式问题的正则平滑随机近似(RSSA)算法。冬季模拟竞赛:模拟在复杂世界中做出决策(IEEE,新泽西州皮斯卡塔韦),933-944。交叉参考
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。