×

时变广义有向网络上多智能体土匪优化的在线分布式对偶平均算法。 (英语) Zbl 1533.68418号

摘要:本文研究多智能体网络上的在线分布式凸优化问题,其中一群智能体试图协调地最小化一系列时变全局损失函数。在每个时隙,全局损失函数被分解为几个局部损失函数的总和,每个局部损失函数依次可用,并由网络上的一个代理私有,并且单个代理不具备未来全局损失函数的先验知识。我们对盗贼设置感兴趣,在盗贼设置中,只有查询点的本地损失函数的值才会透露给单个代理。同时,我们考虑一个一般的多智能体网络,其中智能体的通信被表示为一系列时变非平衡有向图,并且相应的权重矩阵仅为行随机的。我们研究了两种盗贼场景,包括一点盗贼反馈和两点盗贼反馈,然后利用经典的对偶平均方法设计了两种相应的在线分布式盗贼算法。我们表明,只要基准序列的累积变化量随时间呈次线性增长,这两种算法都可以实现次线性预期动态后悔。特别是,当局限于集中式盗贼在线凸优化时,本文获得的预期静态遗憾的界可以减少相关结果。与现有的梯度反馈算法相比,数值试验验证了所提算法的竞争性能。

MSC公司:

68周27 在线算法;流式算法
68宽15 分布式算法
90立方厘米 随机规划
90C25型 凸面编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agarwal,A.,Dekel,O.,Xiao,L.,2010年1月。多点土匪反馈在线凸优化的优化算法。输入:COLT。Citeser,第28-40页。
[2] 阿克巴里,M。;Gharisfard,B。;Linder,T.,时变有向图的分布式在线凸优化,IEEE Trans。网络系统控制。,4, 3, 417-428 (2015) ·Zbl 1507.93085号
[3] 曹,X。;Liu,K.R.,带时变约束和强盗反馈的在线凸优化,IEEE Trans。自动。控制(2018)
[4] 陈,T。;Giannakis,G.B.,Bandit凸优化用于可扩展和动态物联网管理,IEEE Internet Things J,6,1,1276-1286(2019)
[5] Cheng,S。;Dong,Y。;Pang,T。;苏,H。;Zhu,J.,《使用基于传输的先验改进黑盒对手攻击》,高级神经信息。处理系统,32,10934-10944(2019)
[6] 杜奇,J.C。;阿加瓦尔,A。;Wainwright,M.J.,《分布式优化的双重平均:收敛分析和网络缩放》,IEEE Trans。自动。控制,57,3,592-606(2012)·Zbl 1369.90156号
[7] 杜奇,J.C。;M.I.乔丹。;Wainwright,M.J。;Wibisono,A.,《零阶凸优化的最佳速率:两个函数评估的功效》,IEEE Trans。Inf.理论,61,5,2788-2806(2015)·Zbl 1359.90155号
[8] 弗拉克斯曼,A.D。;卡莱,A.T。;McMahan,H.B.,《强盗环境中的在线凸优化:无梯度的梯度下降》,(第十六届ACM-SIAM离散算法研讨会论文集SODA'05(2005),工业和应用数学学会:工业和应用算术学会(美国宾夕法尼亚州费城),385-394·兹比尔1297.90117
[9] Ge,X。;杨,F。;Han,Q.-L.,《分布式网络控制系统:简要概述》,《信息科学》。,380, 117-131 (2017)
[10] 郭,G。;Kang,J.,《针对不匹配干扰的多智能体系统的分布式优化:分层积分控制框架》,IEEE Trans。系统。,网络人:系统。(2021)
[11] 郭,G。;Kang,J。;李,R。;Yang,G.,带间歇通信的受扰多智能体系统的分布式模型参考自适应优化,IEEE Trans。赛博。(2020)
[12] 霍尔,东卡罗来纳州。;Willett,R.M.,《动态环境中的在线凸优化》,IEEE J.《信号处理精选主题》,9,4,647-662(2015)
[13] Hazan,E.,《在线凸优化导论》,Found。最佳趋势。,2, 3-4, 157-325 (2016)
[14] 哈赞,E。;阿加瓦尔,A。;Kale,S.,在线凸优化的对数遗憾算法,机器学习,69,2-3,169-192(2007)·Zbl 1471.68327号
[15] 侯赛尼,S。;查普曼,A。;Mesbahi,M.,通过双重平均进行在线分布式优化,(第52届IEEE决策与控制会议(2013),IEEE),1484-1489
[16] 侯赛尼,S。;查普曼,A。;Mesbahi,M.,动态网络上的在线分布式凸优化,IEEE Trans。自动。控制,61,11,3545-3550(2016)·Zbl 1359.90094号
[17] Kang,J。;郭,G。;Yang,G.,高阶非线性系统的分布式优化:通过预滤波节省计算和通信,IEEE Trans。电路系统。二、快讯(2021年)
[18] Lee,S。;Nedić,A。;Raginsky,M.,具有不可分离全局目标的分散在线优化的协调对偶平均,IEEE Trans。控制网络系统,5,1,34-44(2016)·Zbl 1507.93010号
[19] Lee,S。;Nedić,A。;Raginsky,M.,时变通信图分散在线优化的随机对偶平均,IEEE Trans-Autom。控制,62,12,6407-6414(2017)·Zbl 1390.90426号
[20] 李,C。;Yu,X。;刘,Z.-W。;Huang,T.,交换多智能体系统中的异步脉冲包容控制,信息科学。,370, 667-679 (2016) ·Zbl 1429.93023号
[21] 李,H。;吕,Q。;Huang,T.,时变一般非平衡有向图上的分布式投影次梯度算法,IEEE Trans。自动。控制,64,3,1309-1316(2018)·Zbl 1482.90230号
[22] 李,J。;顾,C。;吴,Z。;Huang,T.,具有时变耦合约束和土匪反馈的分布式凸优化的在线学习算法,IEEE Trans。赛博。(2020)
[23] 李凯。;刘,Q。;曾,Z.,基于量化事件触发通信的分布式资源分配优化多代理系统,信息科学。,577, 336-352 (2021)
[24] 李,R。;Yang,G.-H.,一类具有任意相对度的不确定mimo非线性多智能体系统的分布式优化,信息科学。,506, 58-77 (2020) ·兹比尔1460.93051
[25] Liang,S。;Yin,G.,时变有向图上分布式凸优化的对偶平均推送,IEEE Trans。自动。控制,65,4,1785-1791(2019)·Zbl 07256302号
[26] 吕,Q。;李,H。;Xia,D.,时变有向图和非协调步长分布优化的几何收敛速度,Inf.Sci。,422, 516-530 (2018) ·Zbl 1491.90118号
[27] Lv,Y.-W。;Yang,G.-H。;Shi,C.-X.,通过增广拉格朗日算法实现多智能体系统的差异私有分布式优化,Inf.Sci。,538, 39-53 (2020) ·Zbl 1474.68392号
[28] Mai,V.S。;Abed,E.H.,具有行随机性和约束正则性的有向图的分布式优化,Automatica,102,94-104(2019)·Zbl 1415.93294号
[29] 马特奥斯·努内斯,D。;Cortés,J.,联合连通有向图上的分布式在线凸优化,IEEE Trans。网络科学。工程,1,1,23-37(2014)
[30] Nedić,A。;Olshevsky,A.,时变有向图的分布式优化,IEEE Trans。自动。对照,60,3601-615(2015)·Zbl 1360.90262号
[31] Nedic,A。;Ozdaglar,A.,多智能体优化的分布式次梯度方法,IEEE Trans。自动。控制,54,1,48-61(2009)·Zbl 1367.90086号
[32] 沙赫拉穆尔,S。;Jadbabaie,A.,使用镜像下降的动态环境中的分布式在线优化,IEEE Trans。自动。控制,63,3,714-725(2017)·兹比尔139090125
[33] Shi,C。;Yang,G.-H.,《聚合博弈中的分布式纳什均衡计算:事件触发算法》,《信息科学》。,489, 289-302 (2019) ·Zbl 1452.91055号
[34] Shi,C。;Yang,G.-H.,中继辅助网络上的分布式复合优化,IEEE Trans。系统。,网络人:系统。(2020)
[35] 史,C.-X。;Yang,G.-H.,基于边缘方法的多智能体网络分布式优化的增广拉格朗日算法,Automatica,94,55-62(2018)·Zbl 1400.93011号
[36] Shi,W。;凌,Q。;Wu,G。;Yin,W.,Extra:分散一致性优化的精确一阶算法,SIAM J.Optim。,25, 2, 944-966 (2015) ·Zbl 1328.90107号
[37] 齐亚诺斯,K.I。;劳勒,S。;Rabbat,M.G.,凸优化的Push-sum分布式双重平均,(2012年ieee第51届决策与控制会议(2012),ieee),5453-5458
[38] 王,D。;王,Z。;陈,M。;Wang,W.,有向图上具有约束集和通信延迟的多智能体系统的分布式优化,信息科学。,438, 1-14 (2018) ·Zbl 1440.68308号
[39] 王,Z。;刘杰。;王,D。;Wang,W.,全局等式和不等式约束下多个异质欧拉-拉格朗日系统的分布式协同优化,Inf.Sci。,577, 449-466 (2021)
[40] 谢鹏。;你,K。;坦波,R。;Song,S。;Wu,C.,时变非平衡有向图上带不等式约束的分布式凸优化,IEEE Trans。自动。控制,63,12,4331-4337(2018)·Zbl 1423.90193号
[41] Yan,F。;Sundaram,S。;Vishwanathan,S。;Qi,Y.,《分布式自主在线学习:遗憾与内在隐私保护特性》,IEEE Trans。知识。数据工程,252483-2493(2012)
[42] Yi,X。;李,X。;Yang,T。;谢林。;Chai,T。;Johansson,K.H.,带时变耦合不等式约束的分布式土匪在线凸优化,IEEE Trans。自动。控制(2020年)
[43] 袁,D。;徐,S。;Zhao,H.,通过一致性算法进行多智能体优化的分布式原对偶次梯度方法,IEEE Trans。系统。人。赛博。B、 赛博。,41, 6, 1715-1724 (2011)
[44] Zinkevich,M.,2003年。在线凸规划与广义无穷小梯度提升。摘自:第20届机器学习国际会议论文集(ICML-03)。第928-936页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。