Kybernetika 59 4号, 612-632, 2023

基于交替方向乘子法的分布式纳什均衡跟踪

吉马,郑阳陈紫琴内政部:10.14736/kyb-2023-4-0612

摘要:

纳什均衡因其在经济学、社会科学、计算机科学和工程中的广泛适用性而被公认为非合作博弈论中的一个重要解概念。鉴于其重要性,使用分布式方法寻求静态纳什均衡已经取得了实质性进展。然而,这些方法不适用于动态环境,因为在这种情况下,纳什均衡会随着时间不断变化。本文提出了一种动态算法,可以跟踪非合作博弈中的时变纳什均衡。我们的方法使每个玩家能够使用交替方向的乘数方法更新其动作,同时确保每个玩家的估计动作始终在每个采样瞬间收敛到纳什均衡的邻域。我们证明了最终的跟踪误差与采样间隔成线性比例,这意味着当采样间隔足够小时,跟踪误差可以足够接近于零。最后,通过数值模拟验证了理论结果的正确性。

关键词:

博弈论、交替方向乘数法、时变纳什均衡跟踪

分类:

90C33、68W15

参考文献:

  1. D.Ardagna、B.Panicuchi和M.Passacanado:云系统中服务供应问题的广义纳什均衡。 IEEE传输。服务。计算。6 (2012), 429-442. DOI:10.1109/TSC.2012.14
  2. B.A.Bhatti和R.Broadwater:分布式纳什均衡寻求具有非二次回报的动态微网格能源交易博弈。 《能源》202(2020),117709。 DOI:10.1016/j.energy.2020.117709
  3. H.Le Cadre、P.Jacquot、C.Wan和C.Alasseur:对等电力市场分析:从变分到广义纳什均衡。 欧洲药典。《决议》,282(2020),753-771。 DOI:10.1016/j.ejor.2019.09.035
  4. 陈志忠、马俊杰、梁S.和李L.Li:量化通信下的分布式纳什均衡搜索。 Automatica自动化141(2022),110318。 DOI:10.1016/j.自动2022.110318
  5. C.德佩西斯和S.语法:网络上的分布式平均积分纳什均衡搜索。 自动化110(2019),1085448。 DOI:10.1016/j.自动2019.108548
  6. B.Huang、C.Yang、Z.Meng、F.Chen和W.Ren:多集群系统的分布式非线性布局:一种时变纳什均衡搜索方法。 IEEE传输。网络。52 (2022), 11614-11623. 内政部:10.1109/TCYB.2021.3085583
  7. 李宗仁、李宗仁和丁宗仁:分布式广义纳什均衡搜索及其在Femtocell网络中的应用。 IEEE传输。赛博。,52 (2022), 2505-2517. 内政部:10.1109/TCYB.2020.3004635
  8. X.Li、X.Li、Y.Hong、J.Chen和L.Wang:分散式在线学习调查。 arxiv预印本(2022年)。 内政部:10.48550/arXiv.2205.00473
  9. Q.Ling和A.Ribeiro:通过交替方向乘数法进行分散动态优化。 IEEE传输。信号处理。62 (2014), 1185-1197. 内政部:10.1109/TSP.2013.2295055
  10. K.Lu、G.Jing和L.Wang:非合作博弈广义纳什均衡的分布式搜索算法。 IEEE传输。网络。49 (2019), 2362-2371. 内政部:10.1109/TCYB.2018.2828118
  11. K.Lu、H.Li和L.Wang:动态环境中寻求广义纳什均衡的在线分布式算法。 IEEE传输。自动。控制66(2020),2289-2296。 内政部:10.1109/TAC.2020.3002592
  12. M.Maskery、V.Krishnamurthy和Q.Zhao:认知无线电的分散动态频谱接入:非合作游戏的合作设计。 IEEE传输。Commun公司。57 (2009), 459-469. 内政部:10.1109/TCOMM.2009.02.070158
  13. M.Meng、X.Li、Y.Hong、J.Chen和L.Wang:动态环境下非合作游戏的去中心化在线学习。 arxiv预印本(2021)。 内政部:10.48550/arXiv.2105.06200
  14. A.M.奥斯皮纳、A.Simonetto和E.Dall'Anese:具有人类偏好的网络系统的时间-空间优化。 IEEE传输。控制网络。系统。10 (2023), 503-515. 内政部:10.1109/TCNS.2022.3203467
  15. F.Salehisadaghiani和L.Pavel:分布式纳什均衡寻求:一种基于八卦的算法。 Automatica 72(2016),209-216。 DOI:10.1016/j.自动2016.06.004
  16. A.Simonetto、A.Mokhtari、A.Koppel、G.Leus和A.Ribeiro:一类时变凸优化的预测校正方法。 IEEE传输。信号处理。64 (2016), 4576-4591. DOI10.1109/TSP.2016.2568161号文件
  17. Q.Tao、Y.Liu、C.Xian和Y.Zhao:用于地层布置控制的规定时间分布时变纳什均衡寻求。 IEEE传输。电路系统。,二、 实验简报69(2022),4423-4427。 内政部:10.1109/TCSII.2022.3179576
  18. M.Ye和G.Hu:非合作博弈时变纳什均衡的分布式搜索。 IEEE传输。自动。控制60(2015),3000-3005。 内政部:10.1109/TAC.2015.2414817
  19. M.Ye和G.Hu:基于共识的分布式纳什均衡求解。 IEEE传输。自动。控制62(2017),4811-4818。 内政部:10.1109/TAC.2017.2688452
  20. X.Zeng、J.Chen、S.Liang和Y.Hong:分布式非光滑多集群博弈的广义纳什均衡寻求策略。 Automatica 103(2019),20-26。 DOI:10.1016/j.自动2019.01.025