×

网络系统优化和博弈论控制的最新进展。 (英语) Zbl 1451.93156号

摘要:本文的目的是概述网络系统的最优控制、优化和博弈论方面的最新进展,尽管这些进展并不必要完整。首先,综述了逻辑域网络系统最优控制和博弈论的最新研究成果和进展。然后,介绍了连续域系统网络优化和博弈论的最新发展。最后,在介绍了最优控制和博弈论在网络系统中的一些最新实际应用之后,我们总结了本文,并简要讨论了未来的研究前景。

MSC公司:

93B70型 网络控制
91A80型 博弈论的应用
49N90型 最优控制和微分对策的应用
93-02 与系统和控制理论相关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] F.L.Lewis等人,《多智能体系统的协同控制:最优和自适应设计方法》,Springer Science&Business Media,柏林,2013年。
[2] A.Bempoad等人,《网络控制系统》,第406卷,施普林格,柏林,2010年·Zbl 1201.93003号
[3] A.Galeotti等人,《网络游戏》,Rev.Econ。螺柱,77(1)(2010),218-244·Zbl 1197.91168号
[4] D.Gadjov和L.Pavel,基于无源性的网络纳什均衡寻求方法,IEEE Trans。自动。控制,64(3)(2019),1077-1092·Zbl 1482.91047号
[5] E.Semsar‐Kazerooni和K.Khorasani,《多主体团队合作:博弈论方法》,Automatica,45(10)(2009),2205-2213·Zbl 1179.93025号
[6] A.Rantzer,“将博弈论用于分布式控制工程”,技术报告TFRT-762008。
[7] G.Bacci等人,《网络博弈论:新兴信号处理应用的博弈论工具教程》,IEEE signal Proc。Mag.,33(1)(2016),94-119。
[8] C.Godsil和G.F.Royle,代数图论,第207卷,Springer科学与商业媒体,柏林,2013年。
[9] R.T.Rockafellar,《凸分析》,普林斯顿大学出版社,普林斯顿,2015年。
[10] D.Cheng、H.Qi和Z.Li,《布尔网络的分析和控制:半张量积方法》,施普林格科学与商业媒体,柏林,2010年。
[11] K.Zhang、L.Zhang和L.Xie,“离散时间和离散空间动力系统”,施普林格,柏林,2019年。
[12] D.Cheng、H.Qi和Y.Zhao,《矩阵半张量积及其应用简介》,世界科学出版社,新加坡,2012年·Zbl 1273.15029号
[13] D.Cheng和H.Qi,布尔网络动力学的线性表示,IEEE Trans。自动。《控制》,55(10)(2010),2251-2258·兹伯利1368.37025
[14] Y.Yan、J.Yue和Z.Chen,《使用矩阵半张量积简化布尔网络的代数方法》,《亚洲控制杂志》,在线出版(2019年)。https://doi.org/10.1002/asjc.2125。 ·Zbl 1451.93061号 ·doi:10.1002/asjc.2125
[15] F.Li、J.Sun和Q.‐D。吴,状态时滞布尔控制网络的可观测性,IEEE Trans。神经网络。,22 (6) (2011), 948-954.
[16] K.Zhang和L.Zhang,布尔控制网络的可观测性:基于有限自动机和形式语言理论的统一方法,第33届中国控制会议论文集,IEEE,南京,中国,2014,6854-6861。
[17] R.Li、M.Yang和T.Chu,通过半张量积方法进行布尔网络同步设计,IEEE Trans。神经。Netw公司。学习。系统。,24 (6) (2013), 996-1001.
[18] L.Tong、J.Liang和H.Chen,《布尔控制网络反同步的状态反馈控制器设计:基于事件的思想》,《亚洲J.control》,在线出版(2019年)。https://doi.org/10.1002/asjc.2105 ·Zbl 1451.93130号 ·doi:10.1002/asjc.2105
[19] 李浩,王毅,刘振中,任意开关信号下切换布尔网络的稳定性分析,IEEE Trans。自动。《控制》,59(7)(2014),1978年至1982年·Zbl 1360.93502号
[20] 刘毅,孙立群,卢建群,梁建群,布尔控制网络同步的反馈控制器设计,IEEE Trans。神经系统。Netw公司。学习。系统。,27 (9) (2016), 1991-1996.
[21] 李宏,丁晓霞,逻辑控制网络反馈镇定的控制李雅普诺夫函数方法,SIAM J.控制优化。,57 (2) (2019), 810-831. ·Zbl 1409.93055号
[22] L.Wang、Y.Liu、Z.‐G。Wu,J.Lu和L.Yu,概率布尔控制网络的稳定性和有限时间稳定性,IEEE Trans。系统。人类网络。系统。,在线发布(2019)。https://doi.org/10.1109/TSMC.2019.2898880 ·doi:10.1109/TSMC.2019.289880
[23] Y.Guo、Y.Shen和W.Gui,基于混合指数模型的状态触发脉冲布尔网络稳定性分析,亚洲J.Control,在线出版(2019年)。https://doi.org/10.1002/asjc.2161 ·Zbl 1451.93273号 ·doi:10.1002/asjc.2161
[24] 李毅、朱建军,《关于布尔控制网络的扰动解耦问题》,《亚洲J.控制》,在线出版(2019年)。https://doi.org/10.1002/asjc.2115。 ·Zbl 1451.93177号 ·doi:10.1002/asjc.2115
[25] Q.Zhang,J.e。Feng,B.Wang和M.Meng,具有脉冲效应的布尔控制网络的互模拟及其在可控性中的应用,《亚洲控制杂志》,在线出版(2019年)。https://doi.org/10.1002/asjc.2145 ·Zbl 1451.93038号 ·doi:10.1002/asjc.2145
[26] M.Toyoda,概率布尔网络的贝叶斯选择概率估计,亚洲J.Control,在线出版(2019年)。https://doi.org/10.1002/asjc.2166 ·Zbl 1451.93179号 ·doi:10.1002/asjc.2166
[27] M.Kang、Y.Wu和T.Shen,《通勤车辆燃油效率优化的逻辑控制方法》,国际汽车运动杂志。技术。,18 (3) (2017), 535-546.
[28] J.Zhang和Y.Wu,基于随机逻辑模型的混合动力汽车能量管理问题近似解,科学。下巴。信息科学。,61 (7) (2018), 70207.
[29] E.Fornasini和M.E.Valcher,布尔网络控制的最新发展,J.control Decis。,3 (1) (2016), 1-18.
[30] J.Lu等人,《半张量积方法及其在逻辑网络和其他有限值系统中的应用综述》,IET控制理论应用。,11 (13) (2017), 2040-2047.
[31] A.M.A.Rushdi和F.A.M.Ghaleb,《强调布尔函数表示的矩阵半张量积教程》,J.King Abdulaziz Univ.FCIT,1(2)(2013),1-39。
[32] S.A.Kauffman,随机构建遗传网络中的代谢稳定性和表观发生,《理论生物学杂志》。,22 (3) (1969), 437-467.
[33] D.Laschov和M.Margaliot,单输入布尔控制网络的最大值原理,IEEE Trans。自动。对照,56(4)(2011),913-917·兹比尔1368.93344
[34] D.Laschov和M.Margaliot,布尔网络的最小时间控制,SIAM J.control Optim。,51 (4) (2013), 2869-2892. ·Zbl 1276.49013号
[35] H.Chen、B.Wu和J.Lu,脉冲扰动布尔控制网络的最小时间控制,应用。数学计算。,273 (2016), 477-483. ·Zbl 1410.49023号
[36] F.Li和X.Lu,布尔控制网络的最小能量控制和最优满意控制,Phys。莱特。A、 377(43)(2013),3112-3118·Zbl 1302.93102号
[37] D.Laschov和M.Margaliot,《关于具有最大拓扑熵的布尔控制网络》,Automatica,50(11)(2014),2924-2928·兹比尔1300.93092
[38] E.Fornasini和M.E.Valcher,布尔控制网络的最优控制,IEEE Trans。自动。《控制》,59(5)(2014),1258-1270·Zbl 1360.93387号
[39] 赵彦,李振中,郑德华,逻辑控制网络的最优控制,IEEE Trans。自动。控制,56(8)(2011),1766-1776·Zbl 1368.93396号
[40] D.Cheng、Y.Zhao和J.‐B。刘,有限值网络的最优控制,《第十届世界智能控制与自动化大会论文集》,IEEE,2012年,2274-2279。
[41] Y.Wu等人,《具有平均成本的布尔控制网络的最优控制:策略迭代方法》,Automatica,100(2019),378-387·Zbl 1415.93043号
[42] Liu Z.,Y.Wang和H.Li,概率混合值逻辑动态网络的两种最优控制,科学。下巴。信息科学。,57 (5) (2014), 1-10. ·Zbl 1327.93419号
[43] Y.Zhao、B.K.Ghosh和D.Cheng,通过网络聚合控制大规模布尔网络,IEEE Trans。神经网络。学习。系统。,27 (7) (2016), 1527-1536.
[44] M.Meng和J.‐e。冯,奇异布尔控制网络的最优控制问题,国际控制自动化杂志。系统。,13 (2) (2015), 266-273.
[45] D.Cheng,Y.Zhao,and T.Xu,混合值逻辑网络的基于衰退期的反馈优化,IEEE Trans。自动。《控制》,60(12)(2015),3362-3366·Zbl 1360.93770号
[46] Wu Y.和T.Shen,随机逻辑动力系统有限时域最优控制算法的代数表达式,系统。控制信函。,82 (2015), 108-114. ·Zbl 1417.93339号
[47] 吴彦,随机逻辑动力系统最优控制的策略迭代算法,IEEE Trans。神经网络。学习。系统。,29 (5) (2017), 2031-2036.
[48] M.Toyoda和Y.Wu,关于概率布尔控制网络的最优时变反馈可控性,IEEE Trans。神经网络。学习。系统。,在线发布(2019),https://doi.org/10.1109/TNNLS.20192927241 ·doi:10.1109/TNNLS.2019.2927241
[49] Wu Y.和T.Shen,随机逻辑网络折扣最优控制的有限收敛准则,IEEE Trans。自动。控制,63(1)(2018),262-268·Zbl 1390.93874号
[50] R.Gibbestic等人,“博弈论入门”,皮尔逊高等教育,纽约,1992年·Zbl 0759.90106号
[51] P.Guo,Y.Wang,和H.Li,通过半张量积方法对一类进化网络游戏进行代数公式化和策略优化,Automatica,49(11)(2013),3384-3389·Zbl 1315.93027号
[52] G.Zhao,Y.Wang,Y.Du,一类具有交换拓扑的网络进化博弈的形成,2015年第34届中国控制会议,中国杭州,IEEE,2015,441-446。
[53] J.Nash,《非合作游戏》,《数学年鉴》。,(1951),第286-295页·Zbl 0045.08202号
[54] T.Basar和G.J.Olsder,《动态非合作博弈论》,第23卷,暹罗,1999年·Zbl 0946.91001号
[55] M.I.Abouheaf等人,《多智能体离散时间图形游戏和强化学习解决方案》,Automatica,50(12)(2014),3038-3053·Zbl 1367.91032号
[56] R.Gopalakrishnan、J.R.Marden和A.Wierman,《博弈论控制的架构视图》,ACM SIGMETRICS Perform.Eval。版本,38(3)(2011),31-36。
[57] D.Monderer和L.S.Shapley,《潜在游戏》,《游戏经济》。行为。,14 (1) (1996), 124-143. ·Zbl 0862.90137号
[58] Y.Hino,《检测潜在游戏的改进算法》,《国际博弈论》,40(1)(2011),199-205·Zbl 1213.91028号
[59] D.Cheng,《有限势博弈论》,Automatica,50(7)(2014),1793-1801·Zbl 1296.93069号
[60] X.Liu和J.Zhu,关于有限对策的势方程,Automatica,68(2016),245-253·Zbl 1414.91014号
[61] X.Zhang、Y.Hao和D.Cheng,《不完整的潜在游戏简介》,J.Franklin Inst.,355(2)(2018),862-877·Zbl 1384.93012号
[62] S.‐T公司。Le、Y.Wu和X.‐M。Sun,《具有特定玩家实用功能的拥塞游戏及其在nfv网络中的应用》,IEEE Trans。自动。科学。工程,16(4)(2019),1870-1881。https://doi.org/10.109/TASE.2019.2899504 ·doi:10.1109/TASE.2019.2899504
[63] D.Cheng等人,《网络进化游戏的建模、分析和控制》,IEEE Trans。自动。控制,60(9)(2015),2402-2415·兹比尔1360.91026
[64] X.Gao、J.Wang和D.Yang,通过矩阵方法研究具有时滞的进化博弈的稳定性和稳定性,亚洲J.Control,在线出版(2019)。https://doi.org/10.1002/asjc.2153 ·Zbl 1452.91034号 ·doi:10.1002/asjc.2153
[65] J.R.Marden和J.S.Shamma,《重新审视对数线性学习:异步、完整性和基于回报的实现》,《游戏经济》。行为。,75 (2) (2012), 788-808. ·Zbl 1239.91017号
[66] Y.Hao等人,通过拥塞博弈方法进行合作控制,IEEE Trans。自动。控制,63(12)(2018),4361-4366·Zbl 1423.93115号
[67] D.Cheng等人,关于有限对策的分解子空间,IEEE Trans。自动。控制,61(11)(2016),3651-3656·Zbl 1359.91011号
[68] O.Candogan等人,游戏的流程和分解:调和和潜在游戏,数学。操作。研究,36(3)(2011),474-503·Zbl 1239.91006号
[69] Y.Hao和D.Cheng,《关于不对称博弈》,J.Franklin Inst.,355(6)(2018),3196-3220·Zbl 1395.91011号
[70] J.Koshal、A.Nedić和U.V.Shanbhag,《分布式多用户优化:算法和错误分析》,载于与2009年第28届中国控制会议联合举行的第48届IEEE决策与控制会议(CDC),中国上海,IEEE,2009,4372-4377。
[71] J.N.Tsitsiklis,“分散决策和计算中的问题”,麻省理工学院剑桥信息和决策系统实验室,技术代表,1984年。
[72] J.Tsitsiklis、D.Bertsekas和M.Athans,分布式异步确定性和随机梯度优化算法,IEEE Trans。自动。《控制》,31(9)(1986),803-812·Zbl 0602.90120号
[73] D.P.Bertsekas和J.N.Tsitsiklis,《并行和分布式计算:数值方法》,第23卷,普伦蒂斯·霍尔-恩格尔伍德悬崖出版社,新泽西州,1989年·Zbl 0743.65107号
[74] H.Fawal、D.Georges和G.Bornard,通过分解协调和增广拉格朗日函数的使用实现复杂灌溉系统的最优控制,SMC’98会议论文集。1998年IEEE系统、人和控制论国际会议(分类号98CH36218),第4卷,美国加利福尼亚州圣地亚哥,IEEE,1998年,3874-3879。
[75] M.Rabbat和R.Nowak,传感器网络中的分布式优化,第三届传感器网络信息处理国际研讨会论文集,ACM,加州伯克利,美国,2004,20-27。
[76] I.D.Schizas、A.Ribeiro和G.B.Giannakis,《含噪声链路的hocwsns共识——第一部分:确定性信号的分布式估计》,IEEE Trans。信号处理。,56 (1) (2008), 350-364. ·Zbl 1390.94395号
[77] R.Olfati‐Saber,J.A.Fax和R.M.Murray,《网络多代理系统中的共识与合作》,Proc。IEEE,95(1)(2007),215-233·Zbl 1376.68138号
[78] A.Olshevsky和J.N.Tsitsiklis,分布式共识和平均中的收敛速度,第45届IEEE决策和控制会议论文集,IEEE,加利福尼亚州圣地亚哥,美国,2006,3387-3392。
[79] L.Xiao和S.Boyd,分布平均的快速线性迭代,系统。控制信函。,53(1)(2004),65-78·兹比尔1157.90347
[80] S.Boyd、P.Diaconis和L.Xiao,图上最快混合马尔可夫链,SIAM Rev.,46(4)(2004),667-689·兹比尔1063.60102
[81] W.K.Hastings,“使用马尔可夫链的蒙特卡罗抽样方法及其应用”,《生物特征》,57(1)(1970),97-109·Zbl 0219.65008号
[82] A.Nedic和A.Ozdaglar,多智能体优化的分布式次梯度方法,IEEE Trans。自动。《控制》,54(1)(2009),48-61·Zbl 1367.90086号
[83] B.Johansson、M.Rabi和M.Johansso,网络系统分布式优化的随机增量次梯度方法,SIAM J.Optim。,20 (3) (2009), 1157-1170. ·Zbl 1201.65100号
[84] S.S.Ram、A.Nedić和V.V.Veeravalli,凸优化的增量随机次梯度算法,SIAM J.Optim。,20 (2) (2009), 691-717. ·Zbl 1231.90312号
[85] A.Nedic、A.Olshevsky和W.Shi,在时变图上实现分布式优化的几何收敛,SIAM J.Optim。,27(4)(2017),2597-2633·Zbl 1387.90189号
[86] D.Fudenberg和J.Tirole,博弈论,1991年,坎布。马萨诸塞州,393(12)(1991),80·Zbl 1339.91001号
[87] S.Lasaulce和H.Tembine,《无线网络的博弈论和学习:基础和应用》,学术出版社,马萨诸塞州剑桥市,2011年。
[88] R.D.Yates等人,蜂窝无线电系统上行链路功率控制框架,IEEE J.Sel。公共区域。,13 (7) (1995), 1341-1347.
[89] G.W.Brown,通过虚拟游戏迭代求解游戏,Act。分析。产品分配,13(1)(1951),374-376·Zbl 0045.09902号
[90] 答-答。古诺(Cournot),《富豪数学》(Recherches sur les principles matheques de la theorie des richesses par Augustin Cournot。哈切特(chez L.Hachette),1838年·Zbl 0174.51801号
[91] J.Robinson,《求解游戏的迭代方法》,《数学年鉴》。,(1951), 296-301. ·Zbl 0045.08203号
[92] L.Shapley,《两人游戏中的一些主题》,《高级博弈论》,52(1964),1-29·Zbl 0126.16204号
[93] J.W.Weibull,《进化博弈论》,麻省理工学院出版社,马萨诸塞州剑桥,1997年。
[94] J.S.Shamma和G.Arslan,动态虚拟游戏、动态梯度游戏和纳什均衡的分布式收敛,IEEE Trans。自动。《控制》,50(3)(2005),312-327·Zbl 1366.91028号
[95] F.Facchini和J.‐S。Pang,有限维变分不等式和互补问题,施普林格科学与商业媒体,柏林,2007。
[96] G.Scutari等人,《真实和复杂的单调通信游戏》,IEEE Trans。《信息论》,60(7)(2014),4197-4231·Zbl 1360.91101号
[97] S.D.Flám,平衡、进化稳定性和梯度动力学,《国际博弈论评论》,4(04)(2002),357-370·Zbl 1049.91004号
[98] P.Frihauf、M.Krstic和T.Basar,非合作博弈中的纳什均衡寻求,IEEE Trans。自动。《控制》,57(5)(2012),1192-1207·Zbl 1369.91010号
[99] B.Gharestfard和J.Cortés,双网络零和博弈中的纳什均衡的分布式收敛,Automatica,49(6)(2013),1683-1692·Zbl 1360.91012号
[100] Y.Lou等人,具有交换通信的子网零和博弈中的纳什均衡计算,IEEE Trans。自动。对照,61(10)(2016),2920-2935·Zbl 1359.91022号
[101] Wu,M.Kumar,和T.Shen,内燃机残余气体含量循环变化建模和优化控制的随机逻辑系统方法,应用。热量。工程,93(2016),251-259。
[102] J.Yang、T.Shen和X.Jiao,基于模型的火花点火式发动机剩余气体比例随机最优空燃比控制,IEEE Trans。控制系统。技术。,22 (3) (2014), 896-910.
[103] J.M.Luján等人,《通过缸内压力导数信号检测柴油发动机燃烧的方法》,Mech。系统。信号处理。,24 (7) (2010), 2261-2275.
[104] 吴彦,沈涛,在随机逻辑动力学框架下控制内燃机残余气体分数的策略迭代方法,IEEE Trans。控制系统。技术。,25 (3) (2017), 1100-1107.
[105] S.Mei等人,混合电力系统规划的博弈方法,IEEE Trans。维持。能源,3(3)(2012),506-517。
[106] S.Mei等人,《大规模风电集成下静态备用规划的稳健优化:博弈论方法》,IEEE Trans。维持。《能源》,5(2)(2014),535-545。
[107] S.Mei等人,电力系统稳健优化的博弈模型及其应用,Proc。CSEE,33(19)(2013),47-56。
[108] W.Wei、F.Liu和S.Mei,基于纳什讨价还价和互补方法的环境/经济调度,IEEE Trans。电力系统。,30 (3) (2015), 1548-1549.
[109] W.Saad等人,“智能电网的博弈论方法”,arXiv预印本arXiv:1202.04522012。
[110] S.Mei、W.Wei和F.Liu,《工程博弈论及其在电力系统中的应用》,控制理论技术。,15 (1) (2017), 1-12. ·Zbl 1389.91029号
[111] M.Aldana,无标度拓扑网络的布尔动力学,《物理D:非线性现象》,185(1)(2003),45-66·Zbl 1039.94016号
[112] D.Cheng、Z.Li和H.Qi,布尔控制网络的实现,Automatica,46(1)(2010),62-69·兹比尔1214.93031
[113] Y.Zou和J.Zhu,布尔控制网络的卡尔曼分解,Automatica,54(2015),65-71·Zbl 1318.93043号
[114] Y.Zhao、J.Kim和M.Filippone,面向大规模布尔网络分析的聚合算法,IEEE Trans。自动。控制,58(8)(2013),1976-1985·Zbl 1369.94620号
[115] J.R.Marden,基于州的潜在游戏,Automatica,48(12)(2012),3075-3088·Zbl 1255.93012号
[116] K.G.Vamvoudakis等人,基于博弈论的实时强化学习控制系统算法:如何在线解决多人游戏,IEEE控制系统。Mag.,37(1)(2017),33-52。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。