×

用多元\(B\)样条解含时HJB方程的一种稀疏配置方法。 (英语) Zbl 1297.49053号

摘要:本文提出了一种稀疏配置方法,用于求解与连续时间最优控制问题相关的含时Hamilton-Jacobi-Bellman(HJB)方程,该问题在固定的有限时间内具有积分代价泛函。通过使用值迭代过程将问题转化为递归框架,每个迭代步骤的值函数在特定的状态域上用时变多元单纯形B样条逼近。在配置方案中,用普通的单变量B样条函数进一步逼近样条函数的时间相关系数,以获得完全基于分段多项式的值函数离散化。样条系数是通过求解一系列高度稀疏的二次规划问题来确定的。该算法在一对基准示例问题上进行了验证。仿真结果表明,通过对三角剖分的细化,该方法可以获得更精确的值函数近似。

MSC公司:

49立方米 变分法中的其他数值方法(MSC2010)
90立方厘米 动态编程
90C20个 二次规划
65D07年 使用样条曲线进行数值计算

软件:

工具箱LS
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿布·哈拉夫,M。;Lewis,F.L.,使用神经网络HJB方法实现饱和执行器非线性系统的近似最优控制律,Automatica,41,5,779-791(2005)·Zbl 1087.49022号
[2] Alwardi,H。;王,S。;Jennings,L.S.,Hamilton-Jacobi-Bellman方程的自适应区域分解方法,《全局优化杂志》,56,4,1361-1373(2013)·Zbl 1272.49057号
[3] Alwardi,H。;王,S。;詹宁斯,L.S。;Richardson,S.,HJB方程的自适应最小二乘配置径向基函数方法,全球优化杂志,52,2305-322(2012)·Zbl 1241.49017号
[4] 阿瓦努,G。;Lai,M.J.,三维Navier-Stokes方程的三元样条逼近,计算数学,74,250,585-601(2004)·Zbl 1085.76053号
[5] 阿瓦努,G。;赖,M.J。;Wenston,P.,《离散数据拟合的多元样条方法和偏微分方程的数值解》,(Chen,G.;Lai,M.J.,《小波与样条》(2005),Nashburo出版社),24-75
[6] 巴迪,M。;Capuzzo Dolcetta,I.,Hamilton-Jacobi-Bellman方程的最优控制和粘度解(2008),Birkhäuser:Birkhäuser波士顿·Zbl 1134.49022号
[7] Beard,R.W.,《改善非线性系统的闭环性能》(1995年),伦斯勒理工学院(博士论文)
[8] Bellman,R.E.,《动态编程》(1957),普林斯顿大学出版社·Zbl 0077.13605号
[9] Bertsekas,D.P。;Tsitsiklis,J.N.(神经动力学编程。神经动力学编程,雅典娜科学优化和计算系列(1996年),雅典娜科学)·Zbl 0924.68163号
[10] 博伊德,S。;北卡罗来纳州帕里赫。;朱,E。;Peleato,B。;Eckstein,J.,《通过交替方向乘数法进行分布式优化和统计学习》,《机器学习的基础和趋势》,3,1,1-122(2011)·Zbl 1229.90122号
[11] Cheng,T。;刘易斯,F.L。;Abu-Khalaf,M.,非线性系统固定最终时间最优控制的神经网络解决方案,Automatica,43,3,482-490(2007)·Zbl 1137.93331号
[12] 克兰德尔,M.G。;Evans,L.C。;Lions,P.L.,Hamilton-Jacobi方程粘性解的一些性质,美国数学学会学报,282,2487-502(1984)·Zbl 0543.35011号
[13] de Boor,C.,《B形式基础》(Farin,G.E.,《几何建模:算法和新趋势》(1987),工业和应用数学学会)
[14] 德布尔,C。;Swartz,B.,高斯点的配置,SIAM数值分析杂志,10,4,582-606(1973)·Zbl 0232.65065号
[15] de Visser,C.C。;朱庆平。;Mulder,J.A.,用多元样条曲线进行线性回归的新方法,Automatica,45,12,2903-2909(2009)·Zbl 1192.93117号
[16] de Visser,C.C。;朱庆平。;Mulder,J.A.,用多元样条函数进行有界递归识别的微分约束,Automatica,47,9,2059-266(2011)·Zbl 1229.93041号
[17] de Visser,C.C。;Verhaegen,M.,使用非线性多元样条曲线的自适应光学系统中的波前重建,美国光学学会杂志A,30,1,82-95(2013)
[18] Finlayson,B.A.,(加权残差法和变分原理:在流体力学、传热和传质中的应用。加权残差方法和变分原则:在流体动力学、传热和质量传递中的应用,科学与工程数学系列(1972),美国科学院。按)·Zbl 0319.49020号
[19] Hanselmann,T。;诺克斯,L。;Zaknich,A.,连续时间自适应评论家,IEEE神经网络汇刊,18,3,631-647(2007)
[20] 胡,X。;Han,D。;Lai,M.J.,偏微分方程数值解的不同阶二元样条,SIAM科学计算杂志,29,3,1338-1354(2007)·兹比尔1144.65075
[21] Huang,C.S。;王,S。;Chen,C.S。;Li,Z.C.,Hamilton-Jacobi-Bellman方程的径向基配置法,Automatica,42,12,2201-2207(2006)·Zbl 1104.49024号
[22] 赖,M.J。;Schumaker,L.L.,三角剖分的样条函数(2007),剑桥大学出版社·Zbl 1185.41001号
[24] Osher,S。;Fedkiw,R.,水平集方法和动态隐式曲面(2003),Springer-Verlag:Springer-Verlag纽约·Zbl 1026.76001号
[25] Powell,W.B.,《近似动态编程:解决维度的诅咒》(2007),Wiley-Interscience·Zbl 1156.90021号
[26] Saridis,G.N。;Lee,C.G.,可训练机械手最优控制的近似理论,IEEE系统、人与控制论汇刊,9,3152-159(1979)·Zbl 0398.49001号
[27] Sutton,R.S。;Barto,A.G.(强化学习:简介。强化学习:导论,自适应计算和机器学习(1998),麻省理工学院出版社)
[28] Vamvoudakis,K.G。;Lewis,F.L.,最优控制的在线同步策略迭代方法,(智能控制系统的最新进展(2009)),357-374
[29] Vamvoudakis,K.G。;Lewis,F.L.,解决连续时间无限时域最优控制问题的在线actor-critic算法,Automatica,46,5,878-888(2010)·Zbl 1191.49038号
[30] 王,S。;詹宁斯,L.S。;Teo,K.L.,用逆风有限体积法求解Hamilton-Jacobi-Bellman方程,全球优化杂志,27,2-3177-192(2003)·Zbl 1047.49026号
[31] Wang,F。;张,H。;Liu,D.,《自适应动态编程:简介》(IEEE计算智能杂志(2009)),第39-47页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。