×

小型车间:数据驱动的最优控制分析。2021年5月9日至15日举行的小型车间(混合会议)摘要。 (英语) Zbl 1506.00079号

小结:这个混合型小作坊讨论了最新的数学方法,用于分析数据驱动和机器学习方法用于优化反馈控制的机会和局限性。分析涉及此类方法的所有方面,从近似理论(尤其是通过算法复杂性分析的高维问题)到鲁棒性问题。

MSC公司:

00英镑05 讲座摘要集
00时25分 杂项特定利益的会议记录
49-06 与变分法和最优控制有关的会议记录、会议记录、收藏等
49号35 最优反馈综合
47D06型 单参数半群与线性发展方程
49升12 最优控制和微分对策中的Hamilton-Jacobi方程
93B52号 反馈控制
93D09型 强大的稳定性

软件:

DGM公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.C.Willems、P.Rapisarda、I.Markovsky和B.L.De Moor,“关于激励持续性的说明”,《系统与控制快报》,第54卷,第4期,第325-329页,2005年·Zbl 1129.93362号
[2] I.Markovsky和P.Rapisarda,“数据驱动模拟和控制”,《国际控制杂志》,第81卷,第12期,第1946-1959页,2008年·Zbl 1151.93325号
[3] I.Markovsky和F.Dörfler,“行为环境中的可识别性”,2020年,在线阅读http://homepages.vub.ac.be/imarkovs/publications/identifitability.pdf。
[4] J.Coulson、J.Lygeros和F.Dörfler,“数据增强预测控制:在DeePC的浅滩”,欧洲控制会议,2019年,第307-312页。
[5] –,“分布式鲁棒机会约束数据启用预测控制”,2020,可在https://arxiv.org/abs/2006.01702。
[6] F.Dörfler、J.Coulson和I.Markovsky,“通过正则化和松弛桥接直接和间接数据驱动的对照制剂”,2021年,可在arXiv:2101.01273查阅。
[7] L.Huang、J.Zhen、J.Lygeros和F.Dörfler,“稳健的数据启用预测控制:可牵引公式和性能保证”,2021年,可在arXiv:2105.07199上查阅。工具书类
[8] G.Cybenko,通过sigmoid函数的叠加进行逼近,数学。控制信号系统,2(1989),303-314·Zbl 0679.94019号
[9] S.Dashkovskiy、H.Ito和F.Wirth,《关于耗散Lyapunov形式ISS网络的小增益定理》,《欧洲控制杂志》,17(2011),357-365·Zbl 1237.93160号
[10] S.N.Dashkovskiy,B.S.Rüffer和F.R.Wirth,大系统的小增益定理和ISS Lyapunov函数的构造,SIAM J.控制优化。,48 (2010), 4089-4118. ·Zbl 1202.93008号
[11] J.Darbon、G.P.Langlois和T.Meng,通过神经网络结构克服某些Hamilton-Jacobi偏微分方程的维数灾难,Res.Math。科学。,7(2020),论文编号20,50·Zbl 1445.35119号
[12] W.E,J.Han和A.Jentzen,基于深度学习的高维抛物型偏微分方程和后向随机微分方程的数值方法,通讯。数学。《统计》,5(2017),349-380·Zbl 1382.65016号
[13] L.Grüne,使用深度神经网络计算Lyapunov函数,J.Compute。动态。,8 (2021), 131-152. ·Zbl 1507.68267号
[14] H.N.Mhaskar,平滑函数和解析函数最佳逼近的神经网络,神经计算,8(1996),164-177。
[15] T.Poggio、H.Mhaskar、L.Rosaco、M.Brando和Q.Liao,《为什么以及何时深层网络(而非浅层网络)可以避免维度诅咒:综述》,《国际自动化杂志》。《计算》,14(2017),503-519。
[16] B.S.Rüffer,Monotone Systems,Graphs,and Stability of Large-Scale Interconnected Sys-tems,论文,Fachbereich 3,Mathematik und Informatik,不来梅大学,德国马尼,2007年。
[17] J.Sirignano和K.Spiliopoulos,DGM:解偏微分方程的深度学习算法,J.Compute。物理。,375 (2018), 1339-1364. ·Zbl 1416.65394号
[18] V.I.Zubov,《A.M.Lyapunov方法及其应用》,P.Noordhoff,Groningen,1964年。参考文献·Zbl 0115.30204号
[19] M.Bergounioux和N.Merabet,半线性抛物方程控制问题最优控制的灵敏度分析,控制网络。29 (2000), 861-886. ·Zbl 1002.49023号
[20] J.F.Bonnans和R.Cominetti,Banach空间中的扰动优化。I.基于弱方向约束条件的一般理论,SIAM控制与优化杂志34(1996),1151-1171·Zbl 0862.49022号
[21] J.F.Bonnans和R.Cominetti,Banach空间中的扰动优化。二、。基于强方向约束条件的理论,SIAM控制与优化杂志34(1996),1172-1189·Zbl 0862.49023号
[22] J.F.Bonnans和P.Jaisson,具有时间依赖状态约束的抛物方程的最优控制,SIAM控制与优化杂志48(2010),4450-4571·Zbl 1208.49024号
[23] P.Cannarsa,无限维Hamilton-Jacobi方程解的正则性和非线性最优控制,微分积分方程2(1989),479-493·Zbl 0715.49026号
[24] P.Cannarsa和H.Frankowska,半线性控制问题的值函数和最优性条件。二、。抛物线情况,应用。数学。最佳方案。33 (1996), 1-33. ·Zbl 0862.49021号
[25] P.Cannarsa和H.Frankowska,半线性控制问题的值函数和最优性条件,应用。数学。最佳方案。26 (1992), 139-169. ·Zbl 0765.49001号
[26] P.Cannarsa、H.Frankowska和T.Scarinci,最优控制中Mayer问题的二阶灵敏度关系和值函数的正则性,SIAM控制与优化杂志53(2015),3642-3672·Zbl 1335.49040号
[27] E.Casas,半线性抛物方程状态约束边界控制问题的Pontryagin原理,SIAM控制与优化杂志35(1997),1297-1327·Zbl 0893.49017号
[28] A.V.Fiacco,使用惩罚方法的非线性规划灵敏度分析,数学。编程10(1976),287-311·Zbl 0357.90064号
[29] K.Ito和K.Kunisch,跟踪型非线性最优控制问题的增广拉格朗日SQP方法,SIAM控制与优化杂志34(1996),874-891·Zbl 0860.49023号
[30] D.Kalise和K.Kunisch,高维Hamilton-Jacobi-Bellman方程的多项式逼近及其在半线性抛物线偏微分方程反馈控制中的应用,SIAM科学计算杂志2(2018),629-652·Zbl 1385.49022号
[31] W.Kang和L.C.Wilcox,《缓解维数的诅咒:最优反馈控制的稀疏网格特征方法和HJB方程》,计算优化与应用68(2017),289-315·Zbl 1383.49045号
[32] P.L.Lions,完全非线性二阶方程的粘度解和无限维最优随机控制。有界随机演化的情况,数学学报。161 (1988), 243-278. ·Zbl 0757.93082号
[33] K.Malanowski,状态约束下非线性最优控制问题的稳定性分析,SIAM控制与优化杂志18(2007),926-945·Zbl 1262.49029号
[34] K.Malanowski,状态约束下线性二次型最优控制的稳定性和灵敏度分析,优化56(2007),463-478·Zbl 1139.49022号
[35] K.Malanowski和F.Tröltzsch,抛物型方程参数最优控制问题解的Lipschitz稳定性,Z.Ana。Anwendungen 18(1999),469-489·Zbl 0963.49019号
[36] H.Maurer和H.Pesch,非线性参数控制问题的解可微性,SIAM控制与优化杂志32(1994),1542-1554·Zbl 0820.49012号
[37] A.Porretta和E.Zuazua,长时间与稳态最优控制,SIAM J.控制优化。51 (2013), 4242-4273. ·Zbl 1287.49006号
[38] A.Porretta和E.Zuazua,《关于长时间与稳态最优控制的评论》,气候科学的数学范式,施普林格国际出版社(2016),67-89·Zbl 1369.49008号
[39] J.P.Raymond和H.Zidani,Hamiltonian Pontryagin关于半线性抛物方程控制问题的原理,应用。数学。最佳方案。39 (1999), 143-177. ·Zbl 0922.49013号
[40] J.Soko lowski,分布参数系统控制约束最优控制问题的灵敏度分析,SIAM J.控制优化。25 (1987), 1542-1556. ·Zbl 0647.49019号
[41] E、 W.,Han,J.,and Jentzen,A.高维抛物型偏微分方程和倒向随机微分方程的基于深度学习的数值方法。《数学与统计传播》5,4(2017),349-380·Zbl 1382.65016号
[42] Han,J.和E,W.随机控制问题的深度学习近似。深度强化学习研讨会,NIPS(2016)。
[43] Han,J.和Hu,R.在多智能体博弈中寻找Markovian Nash均衡的深度虚拟博弈。《第一届数学和科学机器学习会议论文集》(2020),第107卷,第221-245页。
[44] Han,J.和Hu,R.时滞随机控制问题的递归神经网络。arXiv预印arXiv:2101.01385(2021)·Zbl 1478.93661号
[45] Han,J.,Jentzen,A.和E,W.使用深度学习求解高维偏微分方程。《美国国家科学院院刊》115,34(2018),8505-8510·Zbl 1416.35137号
[46] Han,J.,Jentzen,A.等人。求解高维偏微分方程的算法:从非线性蒙特卡罗到机器学习。arXiv预印arXiv:2008.13333(2020)。
[47] H.Frankowska。最优控制中的值函数。在数学控制理论中,第1,2部分(的里雅斯特,2001年),ICTP Lect。注释,第八章,第516-653页。Abdus Salam国际中心。理论。物理。,的里雅斯特,2002年·Zbl 1098.49501号
[48] W.Kang和L.C.Wilcox。缓解维数灾难:最优反馈控制的稀疏网格特征法和HJB方程。计算。最佳方案。申请。,68(2):289-315, 2017. ·Zbl 1383.49045号
[49] E.N.Barron和R.Jensen。从动态规划和粘度解到一阶偏微分方程的Pontryagin极大值原理。事务处理。阿默尔。数学。Soc.,298(2):635-6411986年·Zbl 0618.49011号
[50] N.N.Subbotina公司。Hamilton-Jacobi方程的特征线方法及其在动态优化中的应用。索夫雷姆。Mat.Prilozh。,(20,《不同的乌拉夫语》):2004年3月32日。ISSN 1512-1712。英文译本发表在《数学科学杂志》(纽约)[135(2006),第3期]。
[51] B.Azmi、D.Kalise和K.Kunisch。基于梯度增强稀疏多项式回归的最优反馈律恢复。J.马赫。学习。决议,22:1-322021·Zbl 07370565号
[52] G.Albi、S.Bicego和D.Kalise。基于状态相关Riccati方程的最优反馈律的梯度增强监督学习。arXiv:2103.040912021年。
[53] H.T.Banks、B.M.Lewis和H.T.Tran。非线性反馈控制器和补偿器:状态相关的riccati方程方法。计算。最佳方案。申请。,37(2):177-218, 2007. 参考文献·Zbl 1117.49032号
[54] P.M.Anderson和A.A.Fouad。《电力系统控制与稳定》,IEEE出版社,1994年。
[55] A.R.Barron,σ函数叠加的通用近似界,IEEE Trans。信息理论,39(1993),930-945·Zbl 0818.68126号
[56] W.E,C.Ma,S.Wojtowytsch和L.Wu,《基于神经网络的机器学习的数学理解:我们知道什么和不知道什么》,arXiv:2009.10713v32020。
[57] A.N.Kolmogorov,《关于通过一个变量的连续函数和加法的叠加来表示多个变量的持续函数》,In Doklady Akademii Nauk,俄罗斯科学院114:4(1957),953-956·Zbl 0090.27103号
[58] W.Kang和Q.Gong,组合函数的神经网络近似及其在动力系统中的应用,arXiv:2012.01698v12020年12月3日。
[59] H.N.Mhaskar,用于平滑和分析函数的最优逼近的神经网络,神经计算,8:1(1996)164-177。
[60] H.N.Mhaskar和T.Poggio,《深层与浅层网络:一种特定的近似理论》,arXiv:1608.03287v1,2016年·Zbl 1355.68233号
[61] T.Nakamura-Zimmerer,Q.Gong,W.Kang,高维Hamilton-Jacobi-Bellman方程的自适应深度学习,SIAM J.科学计算43:2(2021),1221-1247·Zbl 1467.49028号
[62] T.Poggio,H.Mhaskar,L.Rosasco,B.Miranda,Q.Liao,《为什么以及何时深层网络能够避免维度灾难:综述》,arXiv:1611.00740v5,2017年。
[63] J.Qi、K.Sun和W.Kang,利用经验可观测性Gramian估计电力系统动态状态的最优PMU配置,IEEE Trans。电力系统30:4(2015),2041-2054。
[64] R.Banisch和P.Koltai。理解输运几何:拉格朗日轨道数据的扩散图解开相干集。混沌27(3):0358042017·Zbl 1387.37011号
[65] A.Bittracher、P.Koltai、S.Klus、R.Banisch、M.Dellnitz和Ch.Schütte。复杂亚稳态系统的转移流形:有效动力学的理论和数据驱动计算。非线性科学杂志。,28(2): 471-512, 2018. ·兹伯利06860496
[66] G.弗罗兰。动态等参和拉格朗日相干结构的几何。非线性,28(10),35872015·Zbl 1352.37063号
[67] G.Froyland和P.Koltai。在不进行轨迹积分的情况下估计周期驱动流的长期行为。非线性30,第1948-1986页,2017年·Zbl 1380.37143号
[68] G.Froyland、P.Koltai和M.Stahn。无轨迹积分的非周期流有限时间相干集的计算和最优扰动。SIAM J.应用。动态。系统。19(3), 1659-1700, 2020. ·Zbl 1468.37058号
[69] L.Helfmann、J.Heitzig、P.Koltai、J.Kurths和C.Schütte。基于Agent模型中Tipping路径的统计分析。arXiv预打印arXiv:2103.028832021。
[70] P.Koltai、H.C.Lie和M.Plonka。非确定性动力学中Perron-Frobenius和Koopman算子的Fréchet可微漂移依赖性非线性,32,pp.4232-42572019·Zbl 1475.60104号
[71] P.Koltai和S.Weiss。湍流Rayleigh-Bénard对流中大尺度流动结构的扩散图嵌入和转移矩阵分析。非线性33(4):17232020·Zbl 1439.58021号
[72] S.L.Brunton、J.L.Proctor和J.N.Kutz。通过非线性动力系统的稀疏辨识从数据中发现控制方程。《国家科学院学报》113.15(2016)3932-3937·Zbl 1355.94013号
[73] K.Champion、B.Lusch、J.N.Kutz和S.L.Brunton,2019年。数据驱动的坐标和控制方程发现。《美国国家科学院院刊》,116(45)(2019)22445-22451·Zbl 1433.68396号
[74] B.Lusch、J.N.Kutz和S.L.Brunton。非线性动力学通用线性嵌入的深度学习。《自然通讯》9.1(2018):1-10。
[75] H.Lange、S.L.Brunton和J.N.Kutz。从傅里叶到库普曼:长期时间序列预测的谱方法。机器学习研究杂志22,第41期(2021):1-38·Zbl 07370558号
[76] M.Bergmann、L.Cordier和J.-P.Brancher。采用适当的正交分解降阶模型对圆柱尾流进行最优旋转控制。流体物理学,17:1-212005·Zbl 1187.76044号
[77] K.Bieker、S.Peitz、S.L.Brunton、J.N.Kutz和M.Dellnitz。具有有限传感器数据和在线学习的深度模型预测流量控制。理论和计算流体动力学,34:577-5912020。
[78] S.L.Brunton、J.L.Proctor和J.N.Kutz。通过非线性动力系统的稀疏辨识从数据中发现控制方程。《美国国家科学院院刊》,113(15):3932-39372016·Zbl 1355.94013号
[79] L.Grüne和J.Pannek。非线性模型预测控制。施普林格国际出版公司,2017年第2版·Zbl 1429.93003号
[80] S.Hochreiter和J.Schmidhuber。长短期记忆。神经计算,9(8):1735-17801997。
[81] H.Jaeger和H.Haas。非线性控制:预测混沌系统和无线通信节能。《科学》,304(5667):78-802004。
[82] S.Klus、F.Nuüske、S.Peitz、J.-H.Niemann、C.Clementi和C.Schütte。Koopman生成器的数据驱动ap-proximation:模型简化、系统识别和控制。《物理学D:非线性现象》,406:1324162020年·Zbl 1485.93097号
[83] S.Peitz和K.Bieker。关于数据驱动模型到控制系统的通用转换。arXiv:2021.04722021。
[84] C.W.Rowley、I.Mezić、S.Bagheri、P.Schlater和D.S.Henningson。非线性流的谱分析。《流体力学杂志》,641:115-1272009年·Zbl 1183.76833号
[85] S.Sager、H.G.Bock和M.Diehl。混合积分最优控制中的整数逼近误差。数学规划,133(1-2):1-232012·Zbl 1259.90077号
[86] P.J.施密德。数值和实验数据的动态模式分解。《流体力学杂志》,656:5-282010·兹比尔1197.76091
[87] L.Sirovich(西罗维奇)。湍流与相干结构的动力学第一部分:相干结构。应用数学季刊,XLV(3):561-5711987。参考文献[Beck,2014]Beck,A.(2014)。非线性优化导论:MATLAB的理论、算法和应用。暹罗。
[88] 和Vandenberghe,2004]Boyd,S.和Vanden berghe(2004)。凸优化。剑桥大学出版社·Zbl 1058.90049号
[89] Le,J.和Teel,A.(2021)。混合重锤系统:用于不确定性优化的重置方法。在美国新奥尔良举行的美国控制会议(ACC)上[Lessard,2018]Lessard L.(2018)。算法分析和设计的鲁棒控制方法。美国佛罗里达州迈阿密市CDC控制中机器学习和参数估计交叉点研讨会。
[90] 【Lessard等人,2016年】Lessard,L.、Recht,B.和Packard,A.(2016年)。通过积分二次约束分析和设计优化算法。SIAM J.OPTIM,26(1):57-95。【Michalowsky等人,2020年】Michalowsky,S.、Scherer,C.和Ebenbauer,C.(2020年)。鲁棒和结构利用优化算法:一种积分二次约束方法。《国际控制杂志》,第1-24页·Zbl 1329.90103号
[91] 波利亚克,1987年]波利亚克·B.T.(1987)。优化简介。优化软件,美国纽约[Tarbouriech等人,2011年],Tarbouritech,S.,Garcia,G.,Gomes da Silva Jr,J.-M.,和Queinnec,I.(2011年)。饱和作动器线性系统的稳定性与镇定。斯普林格,伦敦。【Taylor等人,2018年】Taylor,A.、B.Van Scoy和Lessard,L.(2018年)。一阶方法的Lyapunov函数:严格的自动收敛保证。第35届国际机器学习会议,瑞典斯德哥尔摩。
[92] LeCun,Y.、Bengio,Y.和Hinton,G.深度学习。《自然》5217553(2015),436-444。
[93] Cybenko,G.通过S形函数的叠加进行近似。数学。控制信号系统(1989),303-314·Zbl 0679.94019号
[94] Pinkus,A.神经网络中mlp模型的近似理论。Acta Numer公司。8, 1 (1999), 143-195. ·Zbl 0959.68109号
[95] He,K.,Zhang,X.,Ren,S.和Sun,J.图像识别的深度剩余学习。《IEEE计算机视觉和模式识别会议论文集》(2016年),第770-778页。
[96] E、 关于通过动态系统进行机器学习的建议。Commun公司。数学。《统计》第5卷第1页(2017年),第1-11页·Zbl 1380.37154号
[97] Ruiz-Balet,D.和Zuazua,E.分类、近似和传输的神经ODE控制。arXiv预打印arXiv:2104.05278(2021)。
[98] Esteve,C.、Geshkovski,B.、Pighin,D.和Zuazua,E.深度学习中的大时间渐近性。arXiv预印本arXiv:2008.02491(2020)。
[99] Geshkovski,B.控制移动界面和深度学习。博士论文(2021年)。
[100] Esteve Yagüe,C.和Geshkovski,B.通过神经ODE学习的稀疏近似。arXiv预打印arXiv:2102.13566(2021)。记者:Lars Grüne
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。