×

网络化多智能体系统中的混合在线学习控制:一项调查。 (英语) Zbl 1417.93046号

摘要:本文研究的确定性控制系统集成了过去几年中最活跃的三个研究领域:(1)在线学习控制系统,(2)网络化多智能体系统的分布式控制,以及(3)混合动力系统(HDS)。对这类系统的兴趣主要源于两个原因:第一,廉价大规模计算能力和先进通信技术的发展,允许在复杂的网络系统中进行大规模计算;第二,HDS综合理论的最新发展,该理论允许以统一的方式集成连续时间动态系统和离散时间动态系统,从而为复杂的基于学习的控制系统提供统一的建模语言。在本文中,我们旨在对多智能体系统在线学习控制领域的现状进行全面综述,概述了可以解决的不同类型的问题,以及文献中最具代表性的控制体系结构。这些控制结构被建模为HDS,包括作为特殊子集的连续时间动态系统和离散时间动态系统。我们强调了现有结果的不同优势和局限性,以及一些有趣的潜在未来方向和开放问题。

MSC公司:

93甲14 分散的系统
93C40型 自适应控制/观测系统
93立方 由微分方程以外的函数关系控制的控制/观测系统(例如混合系统和开关系统)
68T42型 Agent技术与人工智能
93C55美元 离散时间控制/观测系统
93-02 与系统和控制理论相关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ioannou,P,Sun,J.鲁棒自适应控制。新泽西州上马鞍河:普伦蒂斯·霍尔;2012. ·Zbl 0747.93048号
[2] Sastry,S,Bodson,M。自适应控制:稳定性、收敛性和鲁棒性。恩格尔伍德悬崖,新泽西州:普伦蒂斯·霍尔;1989. ·Zbl 0721.93046号
[3] Krstić,M,Kanellakopoulos,I,Kokotović,PV。非线性和自适应控制设计。纽约州纽约市:John Wiley&Sons;1995年·Zbl 0763.93043号
[4] Sutton,RS,Barto,AG。强化学习:简介。马萨诸塞州剑桥:麻省理工学院出版社;1998. ·Zbl 1407.68009号
[5] KS,Narendra,AM,Annaswamy。稳定自适应系统。纽约州米诺拉:多佛出版社;2012. ·Zbl 1217.93081号
[6] Farrell,JA,Polycarpou,MM。基于自适应逼近的控制:统一神经、模糊和传统自适应逼近方法。新泽西州霍博肯:约翰·威利父子公司;2006
[7] Anderson,BD,Bitmead,RR,Johnson,CR等,自适应系统的稳定性。马萨诸塞州剑桥:麻省理工学院出版社;1986
[8] 阿童木,KJ,维滕马克,比约恩。自适应控制。纽约州米诺拉:多佛出版社;1989. ·Zbl 0697.93033号
[9] Astolfi,A,Karagiannis,D,Ortega,R.非线性和自适应控制及其应用。英国伦敦:施普林格;2008. ·Zbl 1149.93002号
[10] Cao,C,Hovakimyan,N.L1自适应控制理论,保证了快速自适应的鲁棒性。设计与控制进展。SIAM:宾夕法尼亚州费城;2010年·Zbl 1214.93004号
[11] Lewis,FL,Liu,D.反馈控制的强化学习和近似动态规划。计算智能系列。新泽西州霍博肯:约翰·威利/IEEE出版社;2012
[12] Mosca,E.最优、预测和自适应控制。新泽西州上马鞍河:普伦蒂斯·霍尔;1995
[13] Guay,M,Adetola,V,DeHaan,D。非线性系统的鲁棒和自适应模型预测控制。工程技术学院;英国伦敦:2015年·Zbl 1347.93002号
[14] Tao,G.多变量自适应控制:综述。Automatica公司. 2014; 50: 2737‐ 2764. ·Zbl 1300.93101号
[15] Benosman,M.基于模型与数据驱动的自适应控制:概述。Int J Adapt控制信号处理2018年。https://doi.org/10.1002/acs.2862 ·Zbl 1396.93068号
[16] Wooldridge,M.多智能体系统简介。英国奇切斯特:John Wiley&Sons;2009
[17] Hespanha,JP,Naghshtabrizi,P,Xu,Y.网络控制系统最新结果调查。程序IEEE. 2007; 95( 1): 138‐ 162.
[18] Shamma,JS,Arslan,G.合作控制的维度。收录于:JS Shamma,ed.分布式多代理系统的协同控制。新泽西州霍博肯:约翰·威利父子公司;2007: 3‐ 17.
[19] Wang,HF。电力系统意外事件中二次电压控制的多代理协调。IEE Proc-Gener Transm分发. 2001; 148: 61‐ 66.
[20] Pantoja,A,Quijano,N。分布式发电机调度的人口动力学方法。IEEE Trans-Ind-Electron公司. 2011; 58( 10): 4559‐ 4567.
[21] Dorfler,F,Simpson‐Porco,J,Bullo,F.打破微电网的分层分布式控制和经济最优。IEEE传输控制网络系统. 2015; 3(3):241‐253。https://doi.org/10.109/TCNS.2015 ·Zbl 1370.93157号
[22] Bullo,F,Cortés,J.机器人网络的分布式控制。新泽西州普林斯顿:普林斯顿大学出版社;2009. ·Zbl 1193.93137号
[23] Liu,J,Wu,J.多智能体机器人系统。佛罗里达州博卡拉顿:CRC出版社;2001
[24] Martinoli,A,Mondada,F,Correll,N等。分布式自治机器人系统。德国柏林:Springer‐Verlag;2013
[25] Barrero‐Gomez,J,Quijano,N,Ocampo‐Martinez,C。约束分布式优化:种群动力学方法。Automatica公司. 2016; 69: 101‐ 116. ·Zbl 1338.93043号
[26] Nünez,A,Ocampo‐Martinez,C,Maestre‐Torreblanca,JM,De Schutter,B。大系统非集中式模型预测控制的时变方案。数学问题工程师. 2015; V2015:1-17。
[27] Tlig,M,Bhouri,N.城市交通和公交车规则控制的多代理系统。Procedia Soc行为科学. 2011; 20: 896‐ 905.
[28] Balaji,PG,Srinivasan,D.城市交通信号控制中的多代理系统。IEEE计算智能杂志. 2010; 5( 4): 43‐ 51.
[29] Srinivasan,D,Choy,MC,Cheu,RL。实时交通信号控制的神经网络。IEEE Trans Intell Trans系统. 2006; 7( 3): 261‐ 272.
[30] Vidal,R,Shakernia,O,Kim,HJ,Shim,DH,Sastry,S.概率追逃游戏:理论,实现和实验评估。IEEE Trans机器人自动. 2002; 18( 5): 662‐ 669.
[31] Thunberg,J,Song,W,Montijano,E,Hong,Y,Hu,X.具有切换拓扑的多代理系统的分布式姿态同步控制。论文发表于:第十届世界智能控制与自动化大会;2012; 中国北京。
[32] Song,C,Liu,L,Feng,G,Xu,S.圆上异构移动传感器网络的覆盖控制。Automatica公司. 2016; 63: 349‐ 358. ·兹比尔1329.93092
[33] Olfati‐Saber,R,Fax,JA,Murray,RM。网络多代理系统中的共识与合作。程序IEEE. 2007; 95: 215‐ 233. ·Zbl 1376.68138号
[34] Cortes,J,Martinez,S,Karatas,T,Bullo,F.移动传感网络的覆盖控制。论文发表于:IEEE机器人与自动化国际会议;2002; 华盛顿特区。
[35] Fitoussi,D,Tennenholtz,M.为多代理系统选择社会法则:极简性和简单性。Artif智能. 2000; 119( 1‐2): 61‐ 101. ·Zbl 0945.68170号
[36] Jia,P,MirTabatabaei,A,Friedkin,NE,Bullo,F。影响力网络中的舆论动态和社会权力演变。SIAM版本. 2015; 57( 3): 367‐ 397. ·Zbl 1339.91098号
[37] Altin,B,Barton,K.迭代学习控制框架中的L1自适应控制:稳定性、鲁棒性和设计权衡。论文发表于:美国控制会议论文集;2013; 华盛顿特区。
[38] Chien,C.使用模糊网络设计的采样数据迭代学习控制。国际J控制. 2000; 73( 10): 902‐ 913. ·Zbl 1006.93549号
[39] Benosman,M.基于学习的自适应控制:极值寻求方法——理论与应用。马萨诸塞州剑桥:巴特沃思-海尼曼;2016. ·Zbl 1351.93039号
[40] Benosman,M.,基于多参数极值搜索的自动调谐,用于鲁棒输入输出线性化控制。论文发表于:第53届IEEE决策与控制会议论文集;2014年;加利福尼亚州洛杉矶。
[41] Benosman,M,Atinc,G.电磁执行器的非线性自适应控制。论文发表于:SIAM控制与应用会议;2013; 加利福尼亚州圣地亚哥·Zbl 1328.93141号
[42] Benosman,M,Atinc,G.电磁执行器的基于非线性学习的自适应控制。论文发表于:IEEE欧洲控制会议论文集;2013; 瑞士苏黎世。
[43] Benosman,M,Atinc,G.电磁执行器的非线性自适应控制。IET控制理论应用. 2015; 9( 2): 258‐ 269. ·Zbl 1328.93141号
[44] Benosman,M,Xia,M.时变不确定性非线性系统基于极值搜索的间接自适应控制。论文发表于:欧洲控制会议论文集;2015; 奥兹特里亚·林茨。
[45] Guay,M,Zhang,T.参数不确定性非线性动态系统的自适应极值搜索控制。Automatica公司. 2003; 39: 1283‐ 1293. ·Zbl 1035.93041号
[46] Zhang,C,Ordónez,R.极值寻求控制与应用:基于数值优化的方法。纽约州纽约市:斯普林格;2012. ·Zbl 1255.49058号
[47] Khong,SZ,Nesšić,D,Krstić,M.基于极值搜索的迭代学习控制。Automatica公司. 2016; 66: 238‐ 245. ·Zbl 1335.49049号
[48] Frihauf,P,Krstic,M,Basar,T.通过极值搜索实现未知离散时间线性系统的有限时域LQ控制。Eur J控制. 2013; 19( 5): 399‐ 407. ·Zbl 1293.49080号
[49] Benosman,M,Di Cairano,S,Weiss,A.基于极值搜索的迭代学习线性MPC。论文发表于:IEEE系统与控制多重会议;2014年;法国安提布斯。
[50] Subbaraman,A,Benosman,M.基于极值搜索的迭代学习模型预测(ESILC-MPC)[技术报告]。2015https://arxiv.org/abs/1512.02627v1
[51] Gruenwald,B,Yucelen,T.论自适应控制体系结构的瞬态性能改进。国际J控制. 2015; 88( 11): 2305‐ 2315. ·Zbl 1334.93094号
[52] Lewis,FL,Vrabie,D,Vamvoudakis,KG。强化学习和反馈控制:使用自然决策方法设计最优自适应控制器。IEEE控制系统杂志. 2012; 32( 6): 76‐ 105. ·Zbl 1395.93584号
[53] Wang,C,Hill,DJ。用于识别、识别和控制的确定性学习理论。佛罗里达州博卡拉顿:CRC出版社;2010年·兹比尔1247.93001
[54] Wang,C,Hill,DJ,Ge,SS,Chen,G.纯反馈系统自适应神经控制的ISS模块化方法。Automatica公司. 2006; 42( 5): 723‐ 731. ·Zbl 1137.93367号
[55] 亨特,KJ,斯巴巴罗,D,兹比科夫斯基,R,加思罗普,PJ。控制系统的神经网络:综述。Automatica公司. 1992; 28( 6): 1083‐ 1112. ·Zbl 0763.93004号
[56] 姜,ZP,姜,Y.线性和非线性系统的鲁棒自适应动态规划:概述。Eur J控制. 2013; 19( 5): 417‐ 425. ·兹比尔1293.49053
[57] Koszaka,L,Rudek,R,Pozniak‐Koszalka,I.在自适应控制系统中使用强化学习的想法。论文发表于:国际网络会议、国际系统会议和国际移动通信和学习技术会议;2006; 毛里求斯勒莫恩。
[58] Vrabie,D,Vamvoudakis,K,Lewis,FL。强化学习原则下的最优自适应控制和微分对策。英国赫特福德郡:IET数字图书馆;2013. ·Zbl 1316.49007号
[59] Abouheaf,MI,Mahmoud,MS。微电网在线自适应学习控制方案。微电网。马萨诸塞州剑桥:爱思唯尔;2017
[60] Modares,R,Lewis,F,Yucelen,T,Chowdhary,G。使用策略迭代和经验重演对部分未知约束输入系统进行自适应最优控制。论文发表于:AIAA制导、导航和控制会议;2013; 马萨诸塞州波士顿。
[61] Spooner,JT,Maggiore,M,Ordonez,R,Passino,KM。非线性系统的稳定自适应控制和估计。纽约州纽约市:Wiley Interscience;2002
[62] Hjalmarsson,H.从实验设计到闭环控制。Automatica公司. 2005; 41( 3): 393‐ 438. ·Zbl 1079.93016号
[63] Hjalmarsson,H.迭代反馈调优:概述。国际J自适应控制信号程序. 2002; 16(5):373‐395·Zbl 1048.93057号
[64] Benosman,M.,基于多参数极值搜索的自动调谐,用于鲁棒输入输出线性化控制。在第53届决策与控制年会上发表的论文。2016; 加利福尼亚州洛杉矶。
[65] Olfati‐Saber,R,Murray,R。具有切换拓扑和时间延迟的代理网络中的共识问题。IEEE Trans Autom控制. 2004; 49( 9): 1520‐ 1533. ·Zbl 1365.93301号
[66] Jadbabaie,A,Lin,J,Morse,AS。使用最近邻规则协调移动自治代理组。IEEE Trans Autom控制. 2003; 48( 6): 988‐ 1001. ·兹比尔1364.93514
[67] Dorfler,F,Bullo,F。相位振荡器复杂网络中的同步:一项调查。Automatica公司. 2014; 50( 6): 1539‐ 1564. ·Zbl 1296.93005号
[68] Trentelman,HL,Takaba,K,Monshizadeh,N.不确定线性多智能体系统的鲁棒同步。IEEE Trans Autom控制. 2013; 58( 6): 1511‐ 1523. ·Zbl 1369.93053号
[69] Tanner,HG,Pappas,GJ,Kumar,V.领导层对地层稳定性。IEEE Trans机器人自动. 2004; 20( 3): 443‐ 455.
[70] Egerstedt,M,Hu,X.地层约束多智能体控制。IEEE Trans机器人自动. 2001; 17( 6): 947‐ 951.
[71] Olfati‐Saber,R.Flocking for multi-agent动态系统:算法和理论。IEEE Trans Autom控制. 2006; 51( 3): 401‐ 420. ·Zbl 1366.93391号
[72] Tanner,H,Jadbabie,A,Pappas,GJ。固定和交换网络中的群集。IEEE Trans Autom控制. 2007; 52(5):863‐868·兹比尔1366.93414
[73] Godsil,CD,Royle,G.代数图论。数学研究生课文。纽约州纽约市:斯普林格;2001
[74] Mannor,S,Shamma,JS。工程师的多智能体学习。Artif智能. 2007; 171( 7): 417‐ 422. ·Zbl 1168.68477号
[75] Marden,JR,Arslan,G,Shamma,JS。合作控制和潜在博弈。IEEE Trans-Syst Man Cybern第B部分. 2009; 39( 6): 1393‐ 1407.
[76] Sontag,ED,Sussmann,HJ。神经网络数学理论[技术报告]。新泽西州新不伦瑞克:罗格斯大学;1997. ·Zbl 0901.93005号
[77] Goebel,R,Sanfelice,RG,Teel,AR。混合动力系统:建模、稳定性和鲁棒性。新泽西州普林斯顿:普林斯顿大学出版社;2012. ·Zbl 1241.93002号
[78] Cassandras,CG,Lafortune,S.离散事件系统导论。纽约州纽约市:斯普林格;2008. ·兹比尔1165.93001
[79] Liberzon,D.系统和控制中的切换。马萨诸塞州波士顿:Birkhauser;2003. ·Zbl 1036.93001号
[80] Lygeros,J,Sastry,S,Tomlin,C.混合系统:基础、高级主题和应用。专著。https://inst.eecs.berkeley.edu/ee291e/sp18/讲义/book.pdf·Zbl 0951.93012号
[81] ED Sontag,《互连自动机和线性系统:离散时间的理论框架》。柏林,海德堡:施普林格;1996: 436‐ 448.
[82] Sontag,ED。神经网络和控制中的一些主题[技术报告]。新泽西州新不伦瑞克:罗格斯大学;1993
[83] Bollobás,B.现代图论。数学研究生课文。纽约州纽约市:斯普林格;1998年,ISBN 0387984887。
[84] Bullo,F.网络系统讲座。加州圣巴巴拉:加利福尼亚大学;2018
[85] Sanfelice,RG,Goebel,R,Teel,AR。与可检测性和渐近稳定性相关的混合系统的不变性原理。IEEE Trans Autom控制. 2007; 52( 12): 2282‐ 2297. ·Zbl 1366.93554号
[86] Goebel,R,Sanfelice,RG,Teel,AR。通过混合系统技术实现交换系统的不变性原理。系统控制通讯. 2008; 57( 12): 980‐ 986. ·Zbl 1148.93028号
[87] Teel,AR,Forni,F,Zaccarian,L.Lyapunov基于混杂系统指数稳定性的充分条件。IEEE Trans Autom控制. 2013; 58( 6): 1591‐ 1596. ·Zbl 1369.93541号
[88] Subbaraman,A,Teel,AR。关于混合系统的全局递归与光滑Lyapunov函数存在性之间的等价性。系统控制通讯. 2016; 88: 54‐ 61. ·Zbl 1336.93132号
[89] Sanfelice,RG,Teel,AR。混合系统模拟器的动力学特性。Automatica公司. 2010; 46( 2): 239‐ 248. ·Zbl 1205.93079号
[90] Sanfelice,R,Copp,D,Nanez,P.MATLAB/Simulink混合方程(HyEQ)工具箱中混合系统仿真的工具箱。论文发表于:第16届混合系统国际会议论文集:计算与控制;2013; 宾夕法尼亚州费城·Zbl 1364.93383号
[91] 斯米尔诺夫,GV。微分包含理论简介。数学研究生课程;第41卷。罗得岛普罗维登斯:AMS;2002年·Zbl 0992.34001号
[92] Filippov,AF.右侧不连续的微分方程。数学及其应用。荷兰多德雷赫特:施普林格;1988
[93] 克拉索夫斯基,NN。捕获的博弈论问题。俄罗斯莫斯科:瑙卡;1970
[94] 佛罗里达州克拉克。优化和非光滑分析。宾夕法尼亚州费城:SIAM;1990. ·Zbl 0696.49002号
[95] Aubin,JP,Cellina,A.微分包含:集值映射和生存理论。德国柏林:Springer‐Verlag;1984. ·Zbl 0538.34007号
[96] Khalil,香港。非线性系统。新泽西州上马鞍河:普伦蒂斯·霍尔;2002
[97] Vidyasagar,M.非线性系统分析。新泽西州上马鞍河:普伦蒂斯·霍尔;1993. ·Zbl 0900.93132号
[98] Verhulst,F.非线性微分方程和动力系统。德国柏林:施普林格;1996. ·Zbl 0854.34002号
[99] Haddad,WM,Chellaboina,V.非线性动力系统与控制:基于Lyapunov的方法。新泽西州普林斯顿:普林斯顿大学出版社;2008. ·Zbl 1142.34001号
[100] Kellet,CM,Teel,AR。光滑Lyapunov函数和差分包含稳定性的鲁棒性。系统控制通讯. 2004; 52( 5): 395‐ 405. ·Zbl 1157.93470号
[101] Kellet,CM,Teel,AR。关于urn:x-wiley:acs:media:acs2866:acs2866-math-0326的稳健性——差异包含的稳定性:光滑离散时间Lyapunov函数。SIAM J控制优化. 2005; 44(3):777‐800。
[102] 非线性系统:离散时间稳定性和控制。加州圣巴巴拉:加利福尼亚大学;2004
[103] Ogata,K.离散时间控制系统。新泽西州上马鞍河:普伦蒂斯·霍尔;1994. ·Zbl 0869.93002号
[104] Jakubczyk,B,Sontag,ED。非线性离散时间系统的可控性:李代数方法。SIAM J控制优化. 1990; 28( 1): 1‐ 33. ·Zbl 0693.93009号
[105] Freeman,H.离散时间系统:理论简介。纽约州纽约市:Wiley;1965. ·Zbl 0127.09705号
[106] Passino,K.优化、控制和自动化的生物模拟。英国伦敦:施普林格;2016. ·Zbl 1080.93002号
[107] 宾夕法尼亚州Ioannou,自适应控制教程。宾夕法尼亚州费城:SIAM;2006. ·Zbl 1116.93001号
[108] Hou,Z,Jin,S.无模型自适应控制。佛罗里达州博卡拉顿:CRC出版社;2016
[109] Hou,Z,Jin,S.一类MIMO非线性离散时间系统的数据驱动无模型自适应控制。IEEE Trans神经网络. 2011; 22( 12): 2173‐ 2188.
[110] Annaswamy,AM,Skantze,FP,Loh,A.凸/凹参数化连续时间系统的自适应控制。Automatica公司. 1998; 34: 33‐ 49. ·Zbl 0910.93049号
[111] Narendra,KS,Balakrishnan,J.使用多模型的自适应控制。IEEE Trans Autom控制. 1997; 42( 2): 171‐ 187. ·Zbl 0869.93025号
[112] Arcak,M.Passivity作为团队协调的设计工具。IEEE Trans Autom控制. 2007; 52(8):1380‐1390·兹比尔1366.93563
[113] Ihle,I,Arcak,M,Fossen,T.基于无源性的同步路径跟踪设计。论文发表于:第45届IEEE决策与控制会议;2006; 加利福尼亚州圣地亚哥。
[114] Wang,H.不确定运动学和动力学网络机器人系统的基于被动性的同步。Automatica公司. 2013; 49: 755‐ 761. ·Zbl 1267.93159号
[115] Hatanaka,T,Chopra,N,Fujita,M,Spong,M。网络机器人中基于被动性的控制和估计。瑞士查姆:施普林格;2015. ·Zbl 1347.93003号
[116] 孟,DY,贾,YM。具有时变参考轨迹的多智能体系统在有限区间上的跟踪控制。系统控制通讯. 2012; 61( 7): 807‐ 818. ·Zbl 1250.93013号
[117] 彭,Z,王,D,王,H,王,W。有向拓扑下具有动态先导的线性多智能体系统的合作迭代学习控制。Acta Autom Sin公司. 2014; 40( 11): 2595‐ 2601. ·Zbl 1324.93008号
[118] 孟,DY,贾,YM。通过终端反馈迭代学习实现多智能体系统的有限时间共识。IET控制理论应用. 2011; 5( 18): 2098‐ 2110. ·Zbl 1380.93017号
[119] 孟,DY,贾,YM。为多智能体系统设计有限时间一致性协议的迭代学习方法。系统控制通讯. 2012; 61(1):187‐194·Zbl 1250.93012号
[120] Wu,H,Kawabata,H,川端康成,K。具有未知互连的大规模系统的分散迭代学习控制方案。论文发表于:IEEE控制应用会议论文集;2003; 土耳其伊斯坦布尔。
[121] Radenkovic,M,Bose,T.关于多智能体自调谐共识。Automatica公司. 2015; 55:46‐54·兹比尔1378.93012
[122] Ahn、HS、Chen、YQ。多智能体形成的迭代学习控制。论文发表于:ICROS‐SICE国际联合会议记录;2009年;日本福冈。
[123] Meng,D,Jia,Y,Du,J,Zhang,J.关于非线性多智能体系统形成控制的迭代学习算法。Automatica公司. 2014; 50: 291‐ 295. ·Zbl 1298.93029号
[124] Ahn,H,Chen,Y,Moore,K.通过迭代学习控制进行多智能体协调:集中式和分散式策略。论文发表于:IEEE系统与控制多参考会议论文集;2011; 科罗拉多州丹佛市。
[125] Tanaskovic,M,Fagiano,L,Novara,C,Morari,M。非线性系统的数据驱动控制:在线直接方法。Automatica公司. 2017; 75: 1‐ 10. ·Zbl 1351.93062号
[126] Lakshmanan,H,Farias,D.动态代理网络的分散近似动态规划。论文发表于:美国控制会议论文集;2006; 明尼苏达州明尼阿波利斯。
[127] Dougherty,S,Guay,M.传感器网络分布式优化的极值搜索控制器。IEEE Trans Autom控制. 2016; 62( 2): 928‐ 933. https://doi.org/10.1109/TAC.2016.2566806 ·Zbl 1364.90254号
[128] Guay,M,Vandemeulen,I,Dougherty,S,Mclellan,PJ。动态代理网络上的分布式极值搜索控制。论文发表于:美国控制会议论文集;2015; 伊利诺伊州芝加哥。
[129] Ye,M,Hu,G.约束网络优化的分布式极值搜索及其在智能电网能耗控制中的应用。IEEE变速器控制系统技术. 2016; 24( 6): 2048‐ 2058. https://doi.org/10.109/TCST.2016.2517574
[130] 谢,J,刘,C‐C。多代理系统及其应用。J国际电工学会. 2017; 7( 1): 188‐ 197.
[131] McArthur,SDJ,Davidson,EM,Catterson,VM等。电力工程应用的多智能体系统——第1部分:概念、方法和技术挑战。IEEE输电系统. 2007; 22(4):1743-1752。
[132] McArthur,SDJ,Davidson,EM,Catterson,VM等。电力工程应用的多代理系统——第2部分:构建多代理系统的技术、标准和工具。IEEE输电系统. 2007; 22(4):1753-1759。
[133] 徐汇,B,中盛,H,佳奇,L,飘飘,X。使用无模型自适应控制的数据驱动多智能体系统共识跟踪。论文发表于:第28届中国控制与决策会议;2016; 中国银川。
[134] Arel,I,Liu,C,Urbanik,T,Kohls,AG。基于强化学习的网络交通信号控制多代理系统。IET智能交通系统. 2010; 4( 2): 128‐ 135.
[135] Acharya,DS,Nath,NL。多智能体系统在控制工程中的应用现状调查。国际J Innov Res高级工程师. 2015; 4( 4): 113‐ 128.
[136] Oliveira,E,Fischer,K,Stepankova,O。多代理系统:针对哪些应用进行研究。机器人自动系统. 1999; 27( 1‐2): 91‐ 106.
[137] Wang,Y,Garcia,E,Casbeer,D,Zhang,F.多智能体系统的协同控制:理论与应用。新泽西州霍博肯:威利;2017. ·Zbl 1406.93005号
[138] Panait,L,Luke,S.合作式多智能体学习:最新进展。Auton Agent多Agent系统. 2005; 11( 3): 387‐ 434.
[139] Stone,P,Veloso,M.多智能体系统:从机器学习的角度进行的调查。自动机器人. 2000; 8( 3): 345‐ 383.
[140] Narendra,KS,Annaswamy,A.自适应系统中的持续激励。国际J控制. 1987; 45( 1): 127‐ 160. ·Zbl 0627.93041号
[141] Loria,A,Panteley,E,Popović,D,Teel,AR。稳定非自治系统一致收敛的嵌套Matrosov定理和激励持续性。IEEE Trans Autom控制. 2005; 50( 2): 183‐ 198. ·Zbl 1365.93471号
[142] Cai,C,Teel,AR,Goebel,R.混合系统的光滑Lyapunov函数。第二部分:(预)渐近稳定紧集。IEEE Trans Autom控制. 2008; 53( 3): 734‐ 748. ·Zbl 1367.93558号
[143] Poveda,JI,Teel,AR。一类具有动态包含的混合极值搜索控制器的框架。Automatica公司. 2017; 76: 113‐ 126. ·Zbl 1352.93044号
[144] 多层前馈网络是通用逼近器。神经网络. 1989; 2( 5): 359‐ 366. ·Zbl 1383.92015年
[145] Chen,W,Wen,C,Hua,S,Sun,C。一组具有协同PE条件的连续系统的分布式协同自适应辨识与控制。IEEE Trans Autom控制. 2014; 59( 1): 91‐ 106. ·Zbl 1360.93343号
[146] Abouheaf,M,Lewis,FL,Vamvoudakis,KG,Haesaert,S.多代理离散时间图形游戏和强化学习解决方案。Automatica公司. 2014; 50( 12): 3038‐ 3053. ·Zbl 1367.91032号
[147] Kutadinata,RJ,Moase,WH,Manzie,C.纳什均衡寻求中的抖动重复使用。IEEE Trans Autom控制. 2015; 60( 5): 1433‐ 1438. ·Zbl 1360.91014号
[148] Poveda,JI,Quijano,N.Shahshahani梯度类极值搜索。Automatica公司. 2015; 58: 51‐ 59. ·Zbl 1330.49040号
[149] Anderson,BDO,Dehghani,A.自适应控制的挑战——过去、永久和未来。年度收入控制. 2008; 32: 123‐ 135.
[150] Chen,W,Hua,S,Zhang,H。基于共识的闭环神经控制系统分布式协作学习。IEEE跨神经网络学习系统. 2015; 26( 2): 331‐ 345.
[151] Chen,W,Hua,S,Ge,S.使用神经网络对一组离散时间非线性多智能体系统进行基于共识的分布式协作学习控制。Automatica公司. 2014; 50:2254‐2268·Zbl 1297.93010号
[152] Li,J,Li,J.一类具有分布式初始状态学习的异构多智能体系统的迭代学习控制方法。应用数学计算. 2015; 265: 1044‐ 1057. ·Zbl 1410.93012号
[153] Das,A,Lewis,F.未知非线性网络系统同步的分布式自适应控制。Automatica公司. 2010; 46: 2014‐ 2021. ·Zbl 1205.93045号
[154] Das,A,Lewis,FL。具有未知非线性的二阶系统同步的合作自适应控制。国际J鲁棒非线性控制. 2011; 21( 13): 1509‐ 1524. ·Zbl 1227.93006号
[155] Zhang,H,Lewis,FL.具有未知动力学的高阶非线性系统的自适应协同跟踪控制。Automatica公司. 2012; 48: 1432‐ 1439. ·Zbl 1348.93144号
[156] Shen,Q,Jiang,B,Shi,P,Zhao,J.具有时变执行器故障的网络未知非线性多智能体系统的合作自适应模糊跟踪控制。IEEE Trans Fuzzy系统. 2013; 22( 3): 494‐ 504.
[157] Li,J,Li,J.多智能体系统一致性的自适应迭代学习控制。IET控制理论应用. 2013; 47: 136‐ 142.
[158] Li,J,Li,J.二阶多智能体系统协调的自适应迭代学习控制。国际J鲁棒非线性控制. 2014; 24( 18): 3282‐ 3299. ·Zbl 1302.93007号
[159] Yang,S,Xu,JX,Huand,D,Tan,Y.多智能体系统一致性跟踪的最优迭代学习控制设计。系统控制通讯. 2014; 69: 80‐ 89. ·Zbl 1288.93011号
[160] Cui,B,Ma,T,Lewis,FL,Zhao,C,Song,Y,Feng,C。具有未知时滞的异质多智能体混沌系统的分布式自适应一致性控制。IET控制理论应用. 2015; 9( 16): 2414‐ 2422.
[161] Peng,J,Wang,J,Ye,X.未知非线性网络系统的分布式自适应跟踪控制。Acta Autom Sin公司. 2013; 39(10):1729‐1735。
[162] Zhao,L,Jia,Y.执行器故障下多智能体系统基于神经网络的自适应一致性跟踪控制。国际系统科学杂志. 2016; 47( 8): 1931‐ 1942. ·Zbl 1337.93013号
[163] Wen,G,Chen,CLP,Liu,Y,Liu和Z。二阶非线性多智能体系统基于神经网络的自适应领导-跟随共识控制。IET控制理论应用. 2015; 9( 13): 1927‐ 1934.
[164] Peng,Z,Wang,D,Zhang,H,Sun,G.不确定动态多智能体系统自适应同步的分布式神经网络控制。IEEE跨神经网络学习系统. 2014; 25( 8): 1508‐ 1519.
[165] Shen,Q,Shi,P.分布式命令过滤严格反馈形式的非线性多智能体系统的backstepping共识跟踪控制。Automatica公司. 2015; 53: 120‐ 124. ·Zbl 1371.93019号
[166] Li,Z,Duan,Z,Lewis,FL。具有异质匹配不确定性的多智能体系统的分布式鲁棒一致性控制。Automatica公司. 2014; 50: 883‐ 889. ·Zbl 1298.93026号
[167] Vamboudakis,K,Lewis,F,Hudas,G.多智能体差异图形游戏:用于同步优化的在线自适应学习解决方案。Automatica公司. 2012; 48: 1598‐ 1611. ·Zbl 1267.93190号
[168] Jiao,Q,Modares,H,Xu,S,Lewis,FL,Vamvoudakis,KG。分布式控制中干扰抑制的多代理零和微分图形游戏。Automatica公司. 2016; 69: 24‐ 34. ·Zbl 1338.93023号
[169] Hou,Z,Cheng,L,Tan,M.使用网络解决多智能体系统一致性问题的分散鲁棒自适应控制。IEEE Trans-Syst Man Cybern第B部分. 2009; 39( 3): 636‐ 647.
[170] Cheng,L,Hou,Z,Tan,M,Lin,Y,Zhang,W.不确定多智能体系统基于神经网络的自适应领导跟随控制。IEEE Trans神经网络. 2010; 21( 9): 1351‐ 1358.
[171] Shahvali,M,Shojaei,K.具有未知控制方向的非线性多智能体系统的分布式自适应神经控制。非线性动态. 2016; 83(4):2213‐2228·Zbl 1353.93063号
[172] Meng,W,Yang,Q,Sarangapani,J,Sun,Y.具有渐近一致性的非线性多智能体系统的分布式控制。IEEE跨系统人网络系统. 2017; 47( 5): 749‐ 757.
[173] Zhang,H,Feng,T,Liang,H,Luo,Y.线性离散时间多智能体系统基于LQR的最优分布式协同设计。IEEE跨神经网络学习系统. 2017; 28( 3): 599‐ 611.
[174] Kamalapurkar,R,Dinh,H,Walters,P,Dixon,W。具有不确定非线性动力学的代理拓扑网络中协商一致的近似最优合作分散控制。论文发表于:美国控制会议论文集;2013; 华盛顿特区。
[175] Ghasemi,R,Menhaj,M,Afshar,A.一类大型非仿射非线性系统的新型分散模糊模型参考自适应控制器。Eur J控制. 2009; 15( 5): 534‐ 544. ·Zbl 1298.93041号
[176] Vamvoudakis,K,Lewis,FL.多人非零和游戏:耦合Hamilton‐Jacobi方程的在线自适应学习解决方案。Automatica公司. 2011; 第47页:1556‐1569页·Zbl 1237.91015号
[177] 卞,T,江,Y,江,Z。大系统的分散自适应最优控制及其在电力系统中的应用。IEEE Trans-Ind-Electron公司. 2015; 62( 4): 2439‐ 2447.
[178] Cao,Y,Stuart,D,Ren,W,Meng,Z。具有双积分器动力学的多自动车辆分布式控制:算法和实验。IEEE变速器控制系统技术. 2011; 19( 4): 929‐ 938.
[179] Yoo,SJ。严格反馈形式的不确定非线性多智能体系统的分布式自适应控制。Automatica公司. 2013; 49: 2145‐ 2153. ·Zbl 1364.93413号
[180] Mei,J,Ren,W,Li,B,Ma,G.多个未知二阶非线性系统的分布式包容控制及其在网络化拉格朗日系统中的应用。IEEE跨神经网络学习系统. 2015; 26( 9): 1885‐ 1899.
[181] Wang,P,Jia,Y.具有固有非线性动力学的二阶多智能体系统的分布式控制。IET控制理论应用. 2014; 8( 4): 277‐ 287.
[182] 刘,Y,贾,YM。多智能体系统编队控制的迭代学习方法。系统控制器Lett. 2012; 61(1):148‐154·Zbl 1250.93011号
[183] Meng,D,Moore,KL。学习合作:具有切换拓扑的形成代理网络。Automatica公司. 2016; 64: 278‐ 293. ·Zbl 1327.93022号
[184] Li,C,Qu,Z,Weitnauer,MA。非完整移动网络的分布式极值搜索和编队控制。系统控制通讯. 2015; 75: 27‐ 34. ·Zbl 1305.93015号
[185] Song,C,Feng,G,Fan,Y,Wang,Y.多代理网络的分散自适应感知覆盖控制。Automatica公司. 2011; 47: 2749‐ 2756. ·Zbl 1235.93016号
[186] Schwager,M,Slotine,J,Rus,D.分布式覆盖控制的共识学习。论文发表于:IEEE机器人与自动化国际会议论文集;2008年;加利福尼亚州帕萨迪纳·Zbl 1250.93090号
[187] 施瓦格、M、维特斯、议员、鲍尔斯、S、罗斯、D、汤姆林、希杰。机器人传感器网络的鲁棒自适应覆盖控制。IEEE传输控制网络系统. 2015; 4( 3): 462‐ 476. https://doi.org/10.109/TCNS.2015.2512326 ·Zbl 1507.93125号
[188] Xu,J,Soh,YC。大规模动态优化问题的分布式同时摄动方法。Automatica公司. 2016; 72: 194‐ 204. ·Zbl 1344.93015号
[189] Cistelecan,MR。移动无线网络中的功率控制,使用滑模极值搜索控制实现分岔。论文发表于:IEEE控制应用国际会议论文集;2008年;德克萨斯州圣安东尼奥。
[190] Guay,M,Dochain,D.一种理想的多目标极值寻求控制器设计技术。论文发表于:第53届IEEE决策与控制会议;2014年;加利福尼亚州洛杉矶。
[191] Li,H,Peng,J,Xiao,J,Zhou,F,Liu,W,Wang,J.使用势函数和极值搜索算法的协作多智能体系统的分布式编队控制。亚洲J控制. 2008; 10: 201‐ 211.
[192] Biyik,E,Arcak,M.通过极值搜索和基于被动性的协调规则形成梯度爬升。亚洲J控制. 2008; 10: 201‐ 211.
[193] Ye,M,Hu,G.用动力学约束求解势对策。IEEE Trans-Cybern公司. 2016; 46( 5): 1156‐ 1164.
[194] Frihauf,P,Kristic,M,Basar,T.Nash在非合作博弈中寻求均衡。IEEE Trans Autom控制. 2012; 57( 5): 1192‐ 1207. ·Zbl 1369.91010号
[195] Poveda,J,Quijano,N.寻求多人口游戏的极限。论文发表于:第52届IEEE决策与控制会议;2013; 意大利费伦泽。
[196] Pan,Y,Acarman,T,Øzgüner,U.采用极值寻求控制方法的纳什解。论文发表于:第41届IEEE决策与控制会议;2002; 内华达州拉斯维加斯。
[197] Khong,SZ,Tan,Y,Manzie,C,Nesic,D.通过离散时间极值搜索控制进行多代理源搜索。Automatica公司. 2014; 50( 9): 2312‐ 2320. ·Zbl 1297.93014号
[198] Poveda,JI,Teel,AR。一种稳健的事件触发方法,用于快速采样数据极端化和学习。IEEE Trans Autom控制. 2017; 62( 10): 4949‐ 4964. ·Zbl 1390.93374号
[199] Kvaternik,K,Pavel,L.分散极值寻求控制的分析框架。论文发表于:美国控制会议论文集;2012; 加拿大蒙特利尔。
[200] Vandemeulen,I,Guay,M,McLellan,PJ。通过极值搜索控制实现高空气球编队的分布式控制。IEEE变速器控制系统技术. 2017. https://doi.org/10.1109/TCST.2017.26922742
[201] Durr,H,Stankovic,MS,Ebenbauer,C,Johansson,KH。极值搜索系统的李括号近似。Automatica公司. 2013; 49: 1538‐ 1552. ·兹比尔1360.93200
[202] Swaroop、S、Hedrick、JC、Yip、PP、Gerdes、JC。一类非线性系统的动态曲面控制。IEEE Trans Autom控制. 2000; 45( 10): 1893‐ 1899. ·Zbl 0991.93041号
[203] Hudas,G,Vamvoudakis,K,Mikulski,D,Lewis,FL。多智能体系统中团队策略的在线自适应学习。J Def模型模拟. 2012; 9( 1): 59‐ 69.
[204] Li,Z,Ren,W,Liu,X,Xie,L.具有自适应动态协议的线性多智能体系统的分布式一致性。Automatica公司. 2013; 49( 7): 1986‐ 1995. ·Zbl 1364.93023号
[205] Zhou,J,Lu,J,Lu,J.不确定复杂动态网络的自适应同步。IEEE Trans Autom控制. 2006; 51( 4): 652‐ 656. ·Zbl 1366.93544号
[206] Johnson,M,Kamalapurkar,R,Bhasin,S,Dixon,W。不确定连续非线性系统的近似N人非零和博弈解。IEEE Trans神经网络. 1645; 26( 8): 1645‐ 1658.
[207] Mills,G,Krstic,M.一维约束极值搜索。论文发表于:第53届IEEE决策与控制会议;2014年;加利福尼亚州洛杉矶。
[208] Tan、Y、Li、Y、Mareels、IMY。极值搜索受限输入。IEEE Trans Autom控制. 2013; 58( 9): 2405‐ 2410. ·Zbl 1369.93316号
[209] Ariyur,KB,Krstić,M.通过极值搜索控制进行实时优化。新泽西州霍博肯:威利;2003. ·Zbl 1031.93002号
[210] Nesšić,D,Tan,Y,Moase,WH,Manzie,C.求极值的统一方法:基于导数估计的自适应方案。论文发表于:第49届IEEE决策与控制会议;2010; 佐治亚州亚特兰大。
[211] Teel,AR,Moreau,L,Nesšić,D.两个时间尺度系统的输入到状态稳定性的统一框架。IEEE Trans Autom控制. 2003; 48( 9): 1526‐ 1544. ·Zbl 1364.93581号
[212] Liu,S,Krstić,M.随机平均和随机极值搜索。英国伦敦:施普林格;2012. ·Zbl 1253.93003号
[213] Huang,J,Dou,L,Fang,H,Chen,J.多个高阶非线性动力学的基于分布式后继的自适应模糊控制。非线性动态. 2015; 81: 63‐ 75. ·Zbl 1347.93161号
[214] Zhang,H,Jian,H,Luo,Y,Xiao,G.使用强化学习方法对动力学未知的离散时间多智能体系统进行数据驱动的最优一致性控制。IEEE Trans-Ind-Electron公司. 2017; 64( 5): 4091‐ 4100.
[215] Vandemeulen,I,Guay,M,McLellan,PJ。动态不稳定网络的离散时间分布极值搜索控制。IEEE传输控制网络系统. 2017. https://doi.org/10.109/TCNS.2017.2691464
[216] Stanković,M,Johansson,KH,Stipanović,DM。应用于移动传感器网络的分布式纳什均衡寻求。IEEE Trans Autom控制. 2012; 57( 4): 904‐ 919. ·Zbl 1369.91031号
[217] Liu,Y,Jia,Y.用迭代学习方法实现离散时间多智能体系统的鲁棒编队控制。国际系统科学杂志. 2015; 46( 4): 625‐ 633. ·Zbl 1316.93006号
[218] Meng,D,Jia,Y,Du,J.具有初始状态转移、扰动和切换拓扑的多智能体系统的鲁棒一致性跟踪控制。IEEE跨神经网络学习系统. 2015; 26( 4): 809‐ 824.
[219] Teel,AR,Popovic,D.用非线性规划方法求解光滑和非光滑多变量极值问题。论文发表于:美国控制会议进程;2001; 弗吉尼亚州阿灵顿。
[220] 波波维奇博士,极端主义寻求主题[博士论文]。加州圣巴巴拉:加利福尼亚大学;2004
[221] Poveda,JI,Teel,AR。异步多代理采样数据系统中分布式非光滑优化的混合系统方法。论文发表于:第十届IFAC非线性控制系统研讨会进展;2016; 加利福尼亚州蒙特利。
[222] Qu,G,Li,N.加速分布Nesterov梯度下降。2017https://arxiv.org/abs/1705.07176 ·Zbl 07256369号
[223] Nedić,A,Ozdaglar,A.多智能体优化的分布式次梯度方法。IEEE Trans Autom控制. 2009; 54( 1): 48‐ 61. ·Zbl 1367.90086号
[224] Uribe,CA,Lee,S,Gasnikov,A,Nedić,A.分布式优化的优化算法。2017https://arxiv.org/abs/1712.00232 ·Zbl 1464.90062号
[225] Poveda,JI,Teel,AR。采样数据系统异步网络中的分布式鲁棒随机学习。论文发表于:第55届IEEE决策与控制会议;2016; 内华达州拉斯维加斯。
[226] Poveda,JI,Teel,AR。网络采样数据系统稳健同步和协调的混合机制。Automatica公司2017年,审查中。
[227] Yang,S,Xu,J,Li,X,Shen,D.多智能体系统协调的迭代学习控制。新加坡:Wiley/IEEE出版社;2016
[228] Jin,X.高阶非线性多智能体系统一致性跟踪的自适应迭代学习控制。系统控制通讯. 2016; 89: 16‐ 23. ·Zbl 1335.93067号
[229] Poveda,JI,Benosman,M,Teel,AR。具有任意切换图的多代理系统中的分布式极值搜索。IFAC‐纸张在线. 2017; 50( 1): 735‐ 740.
[230] Kutadinata,R,Moase,W,Manzie,C,Zhang,L,Garoni,T。通过极值寻求提高现有城市交通灯控制的性能。运输研究C部分应急技术. 2016; 62: 1‐ 20.
[231] Kutadinata,RJ,Moase,WH,Manzie,C.奇摄动混合系统中的极值搜索。IEEE Trans Autom控制. 2017; 62( 6): 3014‐ 3020. ·Zbl 1369.93303号
[232] Astrom,KJ,Kumar,PR.控制:一种观点。Automatica公司. 2014; 50( 1): 3‐ 43. ·Zbl 1298.93013号
[233] DQ梅恩。模型预测控制:最新发展和未来展望。Automatica公司. 2014; 50:2967‐2986·Zbl 1309.93060号
[234] Ocampo‐Martinez,C,Puig,V,Cembrano,G,Quevedo,J.预测控制策略在城市水循环复杂网络管理中的应用。IEEE控制系统杂志. 2003; 33( 1): 15‐ 41. ·Zbl 1395.93351号
[235] 音乐大师、JM、Muñoz de la Peña、D、Camacho、EF。基于合作博弈的分布式模型预测控制。最优控制应用方法. 2011; 32: 153‐ 176. ·Zbl 1225.93045号
[236] Lamnabhi‐Lagarrigue,F,Annaswamy,A,Engell,S等系统n个d日第页人类未来的控制,研究议程:当前和未来的作用,影响和重大挑战。年收入控制. 2017; 43: 1‐ 64.
[237] Kaelbling,LP,Littman,ML,Moore,AW.强化学习:一项调查。人工智能研究杂志. 1996; 4: 237‐ 285.
[238] Hespanha,J.线性系统理论。新泽西州普林斯顿:普林斯顿大学出版社;2009. ·Zbl 1185.93001号
[239] Tanner,HG,Boddu,A.重新访问多代理导航功能。IEEE Trans机器人. 2012; 1346( 28): 6.
[240] Poveda,JI,Benosman,M,Sanfelice,RG,Teel,AR。用于多车辆系统中鲁棒避障和协调的混合自适应反馈律。论文发表于:美国控制会议论文集;2018; 威斯康星州密尔沃基。
[241] Zhang,T,Li,J.具有有限级σ‐delta量化和随机数据包丢失的多智能体系统的迭代学习控制。IEEE传输电路系统. 2017; 64( 8): 2171‐ 2181.
[242] Hermes,H。不连续向量场和反馈控制。论文发表于:微分方程与动力系统国际研讨会;1967; 波多黎各马亚盖兹·Zbl 0183.15905号
[243] Lyapunov,AM。运动稳定性的一般问题。国际J控制. 1992; 55( 3): 521‐ 790.
[244] Clarke,FH,Ledyaev,YS,Stern,RJ。渐近稳定性和光滑Lyapunov函数。J微分方程. 1998; 149: 69‐ 114. ·Zbl 0907.34013号
[245] Cai,C,Teel,AR,Goebel,R.混合系统的平滑Lyapunov函数——第一部分:存在性等同于鲁棒性。IEEE Trans Autom控制. 2007; 52( 7): 1264‐ 1277. ·Zbl 1366.93430号
[246] Grimm,G,Messina,M,Tuna,S,Teel,AR。非线性模型预测控制非鲁棒的示例。Automatica公司. 2004; 40( 10): 1729‐ 1738. ·Zbl 1079.93018号
[247] 平滑稳定化意味着互质分解。IEEE Trans Autom控制. 1989; 34( 4): 435‐ 443. ·Zbl 0682.93045号
[248] Chase,CJ,Serrano,J,Ramadge,PJ。切换流系统的周期性和混沌:离散控制连续系统的对比示例。IEEE Trans Autom控制. 1993; 38( 1): 70‐ 83. ·Zbl 0773.93050号
[249] Arkadiusz,M.关于Hamilton‐Jacobi‐Bellman方程解的非一致性。应用数学优化2016; 1‐ 13. https://doi.org/10.1007/s00245-016-9393-x
[250] Christiano,P,Shah,Z,Mordatch,I,et al.通过学习深度逆动力学模型从模拟到现实世界的转换。2016https://arxiv.org/abs/1610.03518
[251] Devin,C,Gupta,A,Darrell,T,Abbeel,P,Levine,S。学习用于多任务和多机器人转移的模块化神经网络策略。2016https://arxiv.org/abs/1609.07088
[252] 丹·波尔,AV。动态定价和学习:历史渊源、当前研究和新方向。管理科学调查. 2015; 20( 1): 1‐ 18.
[253] Ratliff,L.激励社会规模网络物理系统的效率【博士论文】。加州伯克利:加利福尼亚大学;2015
[254] Poveda、JI、Brown、PN、Marden、JR、Teel、AR。一类用于信息有限的社会系统的分布式自适应定价机制。论文发表于:第56届IEEE决策与控制会议;2017; 澳大利亚墨尔本。
[255] Nie,Y,Wang,X,Cheng,K.智能城市中电动汽车用户参与的多区域自适应定价控制。IEEE Trans Intell Trans系统. 2017. https://doi.org/10.109/TITS.2017.2759192
[256] Bertsimas,D,Litvinov,E,Sun,XA,Zhao,J,Zheng,T.安全约束机组组合问题的自适应鲁棒优化。IEEE输电系统. 2013; 28( 1): 52‐ 63.
[257] Burger,M,De Persis,C,Allgower,F。带存储的受限分销网络的动态定价控制。IEEE传输控制网络系统. 2015; 2( 1): 88‐ 97. ·Zbl 1370.90035号
[258] Zhang,G,Ma,X,Wang,Y.增强高占用率收费车道运营的自适应收费策略。IEEE Trans Intell Trans系统. 2014; 15( 1): 306‐ 317.
[259] Wan,J,Zhang,R,Gui,X,Xu,B.被动定价:云提供商实现利润最大化的自适应定价策略。IEEE Trans-Netw服务管理. 2016; 13( 4): 941‐ 953.
[260] Teel,AR,Subbaraman,A,Sferlazza,A.随机混合系统的稳定性分析:一项调查。Automatica公司. 2014; 50( 10): 2435‐ 2456. ·Zbl 1301.93168号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。