布泽利斯,乔治一世。;潘云鹏;埃文格洛斯·塞奥多罗。 随机机械系统的数值轨迹优化。 (英语) Zbl 1419.70008号 SIAM J.科学。计算。 41,第4号,A2065-A2087(2019). 摘要:本文针对不确定机械系统,提出了一种新的最优控制框架。我们的工作扩展了微分动态规划,并通过广义多项式混沌(gPC)理论处理不确定性。该方案能够影响具有随机模型参数的非线性系统的概率演化。其可扩展、快速收敛的特性在处理高维问题的gPC扩展时发挥了关键作用。基于拉格朗日原理,我们还证明了变分积分器可以设计成在离散时间内适当传播和线性化gPC表示。这一观察结果使我们能够进一步提高轨迹优化方法的效率。数值模拟支持上述论点,同时证明了我们的方法相对于标准优化方法的优势。最后,对该算法的性能进行了全面的分析。 引用于1文件 MSC公司: 03时70分 拉格朗日方程 41A10号 多项式逼近 49公里45 随机问题的最优性条件 49升20 最优控制与微分对策中的动态规划 93E20型 最优随机控制 关键词:轨迹优化;多项式混沌;微分动态规划;离散力学 软件:PILCO公司 PDF格式BibTeX公司 XML格式引用 \textit{G.I.Boutselis}等人,SIAM J.Sci。计算。41,第4号,A2065--A2087(2019;Zbl 1419.70008) 全文: 内政部 参考文献: [1] D.P.Bertsekas,动态规划与最优控制《雅典娜科学》第二版,2000年。 [2] G.Blatman和B.Sudret,随机有限元分析中稀疏多项式混沌展开的自适应算法,可能性。工程机械。,25(2010年),第183-197页。 [3] G.I.Boutselis、G.De La Torre和E.A.Theodorou,多项式混沌变分积分器的随机最优控制,2016年美国控制会议(ACC),马萨诸塞州波士顿,2016年,第6586-6591页。 [4] G.I.Boutselis、Y.Pan、G.De La Tore和E.A.Theodorou,参数不确定机械系统的随机轨迹优化,预打印,https://arxiv.org/abs/1705.05506, 2017. [5] G.I.Boutselis和E.A.Theodorou,参数不确定性和随机扰动下轨迹优化的谱变分积分器2016年IEEE第55届决策与控制会议(CDC),内华达州拉斯维加斯,2016年,第2016-2022页。 [6] P.G.Constantine、M.S.Eldred和E.T.Phipps,稀疏伪谱近似方法,计算。方法应用。机械。工程,229/232(2012),第1-12页·Zbl 1253.65117号 [7] M.Deisenroth和C.Rasmussen,PILCO:基于模型和数据效率的政策搜索方法2011年,在国际机器学习会议上,ICML 2011,Omnipress,2011。 [8] M.Diehl、H.J.Ferreau和N.Haverbeke,非线性MPC和动时域估计的有效数值方法,施普林格,柏林,海德堡,2009年,第391-417页·Zbl 1195.93038号 [9] P.Dutta和R.Bhattacharya,多项式混沌和高阶矩更新的非线性估计,载于美国控制会议(ACC),IEEE出版社,2010年,第3142-3147页,https://doi.org/10.1109/ACC.2010.5531023。 [10] M.Eldred和J.Burkardt,非侵入多项式混沌与随机配置方法在不确定性量化中的比较2009年,在美国航空航天研究所举行的第47届AIAA航空航天科学会议上,包括新视野论坛和航空航天博览会。 [11] J.Fisher和R.Bhattacharya,随机参数不确定性系统的线性二次调节《自动化杂志》,IFAC,45(2009),第2831-2841页·Zbl 1192.93127号 [12] R.Ghanem,通用随机有限元实现的要素,计算。方法应用。机械。工程,168(1999),第19-34页·Zbl 0943.65008号 [13] G.H.Golub和J.H.Welsch,高斯求积规则的计算,数学。公司。,23(1969年),第221-230页·Zbl 0179.21901号 [14] 侯天佑、罗文华、罗佐夫斯基和周海明,流体力学随机受迫方程的Wiener混沌展开及数值解,J.计算。物理。,216(2006),第687-706页·Zbl 1095.76047号 [15] F.S.Hover和M.S.Triantafylou,多项式混沌在稳定性和控制中的应用《自动化杂志》,IFAC,42(2006),第789-795页·Zbl 1110.93052号 [16] D.H.Jacobson和D.Q.Mayne,差分动态编程爱思唯尔出版社,1970年·Zbl 0223.49022号 [17] E.Johnson、J.Schultz和T.Murphey,用于分析和最优控制的离散机械系统的结构线性化,IEEE传输。自动化。科学。工程,12(2015),第140-152页。 [18] H.J.Kappen,非线性随机系统控制的线性理论,物理。修订稿。,95(2005),第200-201页。 [19] L.Kharevych、W.Yang、Y.Tong、E.Kanso、J.E.Marsden、P.Schro¨der和M.Desbrun,计算机动画的几何变分积分器,《ACM SIGGRAPH/欧洲制图计算机动画研讨会论文集》,2006年,第43-51页。 [20] M.Kobilarov、M.Desbrun、J.E.Marsden和G.S.Sukhatme,对称系统的离散几何最优控制框架《机器人:科学与系统III》,W.Burgard、O.Brock和C.Stachniss主编,麻省理工学院出版社,2008年·兹比尔1448.70012 [21] 廖立中,离散时间最优控制微分动态规划和牛顿法的全局收敛性《技术报告》,香港浸会大学数学系,香港九龙塘,1996年。 [22] L.Z.Liao和C.A.Shoemaker,无约束离散时间微分动态规划的收敛性,IEEE传输。自动化。控制,36(1991),第692-706页·Zbl 0760.49016号 [23] N.Mansard、O.Khatib和A.Kheddar,在任务堆栈中集成单边约束的统一方法,IEEE传输。《机器人学》,25(2009),第670-685页。 [24] J.E.Marsden和M.West,离散力学和变分积分器,实绩数字。,10(2001年),第357-514页·Zbl 1123.37327号 [25] J.Nocedal和S.J.Wright,数值优化第二版,施普林格出版社,纽约,2006年·Zbl 1104.65059号 [26] Y.Pan和E.Theodorou,概率微分动态规划《神经信息处理系统进展》,2014年,第1907-1915页。 [27] J.Pasini和T.Sahai,基于多项式混沌的哈密顿和混沌系统不确定性量化,第52届IEEE决策与控制年会(CDC),2013年,第1113-1118页,https://doi.org/10.1109/CDC.2013.6760031。 [28] C.E.Rasmussen和C.K.I.Williams,机器学习的高斯过程(自适应计算和机器学习)麻省理工出版社,2005年。 [29] Y.Tassa、N.Mansard和E.Todorov,控制限制微分动态规划,IEEE机器人与自动化国际会议(ICRA),2014年,第1168-1175页,https://doi.org/10.109/ICRA.2014.6907001。 [30] E.Theodorou、J.Buchli和S.Schaal,强化学习的广义路径积分控制方法,J.马赫。学习。第11号决议(2010年),第3137-3181页·Zbl 1242.68254号 [31] E.Todorov和W.Li,约束非线性随机系统局部最优反馈控制的广义迭代LQG方法,载于《美国控制会议论文集》第1卷,IEEE出版社,2005年,第300-306页,https://doi.org/10.1109/ACC.2005.1469949。 [32] G.D.L.Torre和E.Theodorou,用于系统传播和线性化的随机变分积分器2015年,在数学及其应用研究所IMA机器人数学会议上,https://ima.org.uk/procesedings-ima-conference-mathematics-robots/。 ·Zbl 1498.49029号 [33] X.Wan和G.E.Karniadakis,随机微分方程的自适应多元广义多项式混沌方法,J.计算。物理。,209(2005),第617-642页·Zbl 1078.65008号 [34] N.维纳,均匀混沌阿默尔。数学杂志。,(1938年),第897-936页。 [35] D.Xiu,随机计算的数值方法:谱方法普林斯顿大学出版社,2010年·Zbl 1210.65002号 [36] D.Xiu和G.E.Karniadakis,随机微分方程的Wiener-Askey多项式混沌,SIAM科学杂志。计算。,24(2002),第619-644页,https://doi.org/10.1137/S1064827501387826。 ·Zbl 1014.65004号 [37] Y.Xu和P.Vedula,基于矩的非线性随机跟踪控制方法,非线性动力学。,67(2012),第119-128页·Zbl 1242.93125号 [38] Y.Xu和M.Xin,航天运载火箭的非线性随机控制,IEEE传输。航空航天电子系统,47(2011),第98-108页。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。