×

基于神经网络和原始活动集的大规模模型预测控制。 (英语) 兹比尔1478.93162

摘要:本文提出了一种显式隐式方法来计算模型预测控制(MPC)律,并保证了其递归可行性和渐近稳定性。该方法将离线训练的全连接神经网络与在线原始活动集求解器相结合。神经网络提供控制输入初始化,而原始活动集方法确保递归可行性和渐近稳定性。神经网络用一个原-对偶损失函数进行训练,旨在生成原始可行的控制序列,并满足所需的次优水平。由于神经网络本身不能保证约束满足,其输出用于在线预热原始主动集方法。我们证明,这种方法可以扩展到具有数千个优化变量的大型问题,这对当前方法来说是一个挑战。与不同求解器和初始化策略的基准套件中的最佳方法相比,我们的方法实现了在线推理时间减少2倍。

MSC公司:

93B45码 模型预测控制
93磅70 网络控制
93D20型 控制理论中的渐近稳定性
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abadi,M.、Barham,P.、Chen,J.、Chen-Z.、Davis,A.和Dean,J.等人(2016年)。Tensorflow:用于大规模机器学习的系统。在操作系统设计和实现专题讨论会上,第16卷(第265-283页)。
[2] Arora,R.、Basu,A.、Mianjy,P.和Mukherjee,A.(2018年)。了解具有校正线性单元的深层神经网络。在学习代表国际会议上。统一资源定位地址https://openreview.net/forum?id=B1J_rgWRW。
[3] 博雷利,F。;Bemporad,A。;Morari,M.,《线性和混合系统的预测控制》(2017),剑桥大学出版社·Zbl 1365.93003号
[4] Bouffard,P.、Aswani,A.和Tomlin,C.(2012年)。基于学习的四电机模型预测控制:车载实现和实验结果。IEEE机器人与自动化国际会议(第279-284页)。
[5] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社·Zbl 1058.90049号
[6] Chen,S.、Saulnier,K.、Atanasov,N.、Lee,D.D.、Kumar,V.和Pappas,G.J.等人(2018年)。使用约束神经网络逼近显式模型预测控制。在美国控制会议上(第1520-1527页)。
[7] 钻石,S。;Boyd,S.,CVXPY:一种用于凸优化的嵌入python的建模语言,《机器学习研究杂志》,17,83,1-5(2016)·兹比尔1360.90008
[8] Erez,T.、Lowrey,K.、Tassa,Y.、Kumar,V.、Kolev,S.和Todorov,E.(2013)。仿人机器人实时模型预测控制集成系统。IEEE关于仿人机器人的国际会议(第292-299页)。
[9] 费罗,H。;博克·H。;Diehl,M.,《克服显式MPC局限性的在线主动集策略》,《鲁棒与非线性控制国际期刊》,18,8,816-830(2008)·Zbl 1284.93100号
[10] 费罗,H.J。;柯奇斯,C。;Potschka,A。;博克·H·G。;Diehl,M.,QpOASES:二次规划的参数活动集算法,《数学规划计算》,6,4,327-363(2014)·Zbl 1302.90146号
[11] Gill,体育。;默里,W。;桑德斯,医学硕士。;Wong,E.,SQOPT 7.7用户指南:大型线性和二次规划软件技术报告(2018),加州大学圣地亚哥分校数学系
[12] 古德费罗,I。;Y.本吉奥。;A.Courville,《深度学习》(2016),麻省理工学院出版社·Zbl 1373.68009号
[13] Herceg,M.、Kvasnica,M.,Jones,C.和Morari,M..(2013年)。多参数工具箱3.0。在欧洲控制会议上(第502-510页)。
[14] Hertneck,M。;科勒,J。;特林佩,S。;Allgöwer,F.,学习具有保证的近似模型预测控制器,IEEE Control Systems Letters,2,3,543-548(2018)
[15] 约翰·E。;《固定维线性规划内点方法中热启动策略的实施》,Y'ldírím,E.A.,计算优化与应用,41,2,151-183(2008)·Zbl 1168.90554号
[16] Jones,C.N。;Morari,M.,显式模型预测控制器的多主题近似,IEEE Trans。自动。控制,55,11,2542-2553(2010)·Zbl 1368.93172号
[17] Kingma,D.P.和Ba,J.(2015)。亚当:一种随机优化方法。在学习代表国际会议上。
[18] 克劳乔,M。;卡鲁兹,M。;Kvasnica,M.,嵌入式模型预测控制中基于机器学习的主动集方法暖启动,人工智能工程应用,77,1-8(2019)
[19] Kvasnica,M。;Fikar,M.,显式MPC中基于剪辑的复杂性降低,IEEE Trans。自动。控制,57,7,1878-1883(2012)·Zbl 1369.93344号
[20] Liu,S.、Atanasov,N.、Mohta,K.和Kumar,V.(2017年)。使用线性二次最小时间控制的基于搜索的四驱机器人运动规划。IEEE/RSJ关于智能机器人和系统的国际会议(第2872-2879页)。
[21] 露西亚,S。;Karg,B.,基于深度学习的鲁棒非线性模型预测控制方法,IFAC-PapersOnLine,51,20,511-516(2018)
[22] 秦圣杰。;Badgwell,T.A.,《工业模型预测控制技术调查》,控制工程实践,11,7,733-764(2003)
[23] 里希特,C。;维加·布朗,W。;Roy,N.,BayesIan learning for safe high navigation in unknown environments,(机器人研究,第2卷(2018),Springer),325-341
[24] Ross,S.、Gordon,G.和Bagnell,D.(2011年)。将模仿学习和结构化预测减少为无更新的在线学习。《人工智能和统计国际比较》(第627-635页)。
[25] Sobol’,I.M.,《关于立方体中点的分布和积分的近似计算》,苏联计算数学和数学物理,7,4(1967)·Zbl 0185.41103号
[26] 萨默斯,S。;Jones,C.N。;Lygeros,J。;Morari,M.,快速显式模型预测控制的多分辨率近似方法,IEEE自动控制汇刊,56,11,2530-2541(2011)·Zbl 1368.93416号
[27] Vempala,S.,《几何随机漫步:一项调查》,组合与计算几何,52,577-616(2005)·兹比尔1106.52002
[28] Vichik,S。;Borrelli,F.,用模拟电路求解线性和二次规划,计算机与化学工程,70160-171(2014)
[29] Wang,Y。;Boyd,S.,使用在线优化的快速模型预测控制,IEEE控制系统技术事务,18,2,267-278(2010)
[30] Watterson,M.和Kumar,V.(2015)。安全后退地平线控制,用于具有有限距离感测功能的MAV攻击性飞行。IEEE/RSJ智能机器人和系统国际会议(第3235-3240页)。
[31] 赖特,S。;Nocedal,J.,数值优化,Springer Science,35,67-68,7(1999)·Zbl 0930.65067号
[32] Zeilinger,M.N。;Jones,C.N。;Morari,M.,使用显式MPC和在线优化相结合的实时次优模型预测控制,IEEE自动控制汇刊,56,7,1524-1534(2011)·Zbl 1368.93417号
[33] 张,X。;布贾巴鲁阿,M。;Borrelli,F.,使用原对偶神经网络进行模型预测控制的安全和近最优策略学习,美国控制会议,354-359(2019)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。