文件Zbl 1297.49053-zbMATH Open

用多元\（B\）样条解含时HJB方程的一种稀疏配置方法。（英语） Zbl 1297.49053号

Automatica公司 50，第9期，2234-2244（2014）.

摘要：本文提出了一种稀疏配置方法，用于求解与连续时间最优控制问题相关的含时Hamilton-Jacobi-Bellman（HJB）方程，该问题在固定的有限时间内具有积分代价泛函。通过使用值迭代过程将问题转化为递归框架，每个迭代步骤的值函数在特定的状态域上用时变多元单纯形B样条逼近。在配置方案中，用普通的单变量B样条函数进一步逼近样条函数的时间相关系数，以获得完全基于分段多项式的值函数离散化。样条系数是通过求解一系列高度稀疏的二次规划问题来确定的。该算法在一对基准示例问题上进行了验证。仿真结果表明，通过对三角剖分的细化，该方法可以获得更精确的值函数近似。

引用于1审查

引用于三文件

MSC公司：

49立方米	变分法中的其他数值方法（MSC2010）
90立方厘米	动态编程
90C20个	二次规划
65D07年	使用样条曲线进行数值计算

关键词：

最优反馈控制;哈密尔顿-雅可比-贝尔曼方程;自适应动态规划;样条曲线;配置法

软件：

工具箱LS

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	阿布·哈拉夫，M。；Lewis，F.L.，使用神经网络HJB方法实现饱和执行器非线性系统的近似最优控制律，Automatica，41，5，779-791（2005）·Zbl 1087.49022号
[2]	Alwardi，H。；王，S。；Jennings，L.S.，Hamilton-Jacobi-Bellman方程的自适应区域分解方法，《全局优化杂志》，56，4，1361-1373（2013）·Zbl 1272.49057号
[3]	Alwardi，H。；王，S。；詹宁斯，L.S。；Richardson，S.，HJB方程的自适应最小二乘配置径向基函数方法，全球优化杂志，52，2305-322（2012）·Zbl 1241.49017号
[4]	阿瓦努，G。；Lai，M.J.，三维Navier-Stokes方程的三元样条逼近，计算数学，74，250，585-601（2004）·Zbl 1085.76053号
[5]	阿瓦努，G。；赖，M.J。；Wenston，P.，《离散数据拟合的多元样条方法和偏微分方程的数值解》，（Chen，G.；Lai，M.J.，《小波与样条》（2005），Nashburo出版社），24-75
[6]	巴迪，M。；Capuzzo Dolcetta，I.，Hamilton-Jacobi-Bellman方程的最优控制和粘度解（2008），Birkhäuser：Birkhäuser波士顿·Zbl 1134.49022号
[7]	Beard，R.W.，《改善非线性系统的闭环性能》（1995年），伦斯勒理工学院（博士论文）
[8]	Bellman，R.E.，《动态编程》（1957），普林斯顿大学出版社·Zbl 0077.13605号
[9]	Bertsekas，D.P。；Tsitsiklis，J.N.（神经动力学编程。神经动力学编程，雅典娜科学优化和计算系列（1996年），雅典娜科学）·Zbl 0924.68163号
[10]	博伊德，S。；北卡罗来纳州帕里赫。；朱，E。；Peleato，B。；Eckstein，J.，《通过交替方向乘数法进行分布式优化和统计学习》，《机器学习的基础和趋势》，3，1，1-122（2011）·Zbl 1229.90122号
[11]	Cheng，T。；刘易斯，F.L。；Abu-Khalaf，M.，非线性系统固定最终时间最优控制的神经网络解决方案，Automatica，43，3，482-490（2007）·Zbl 1137.93331号
[12]	克兰德尔，M.G。；Evans，L.C。；Lions，P.L.，Hamilton-Jacobi方程粘性解的一些性质，美国数学学会学报，282,2487-502（1984）·Zbl 0543.35011号
[13]	de Boor，C.，《B形式基础》（Farin，G.E.，《几何建模：算法和新趋势》（1987），工业和应用数学学会）
[14]	德布尔，C。；Swartz，B.，高斯点的配置，SIAM数值分析杂志，10，4，582-606（1973）·Zbl 0232.65065号
[15]	de Visser，C.C。；朱庆平。；Mulder，J.A.，用多元样条曲线进行线性回归的新方法，Automatica，45，12，2903-2909（2009）·Zbl 1192.93117号
[16]	de Visser，C.C。；朱庆平。；Mulder，J.A.，用多元样条函数进行有界递归识别的微分约束，Automatica，47，9，2059-266（2011）·Zbl 1229.93041号
[17]	de Visser，C.C。；Verhaegen，M.，使用非线性多元样条曲线的自适应光学系统中的波前重建，美国光学学会杂志A，30，1，82-95（2013）
[18]	Finlayson，B.A.，（加权残差法和变分原理：在流体力学、传热和传质中的应用。加权残差方法和变分原则：在流体动力学、传热和质量传递中的应用，科学与工程数学系列（1972），美国科学院。按）·Zbl 0319.49020号
[19]	Hanselmann，T。；诺克斯，L。；Zaknich，A.，连续时间自适应评论家，IEEE神经网络汇刊，18，3，631-647（2007）
[20]	胡，X。；Han，D。；Lai，M.J.，偏微分方程数值解的不同阶二元样条，SIAM科学计算杂志，29，3，1338-1354（2007）·兹比尔1144.65075
[21]	Huang，C.S。；王，S。；Chen，C.S。；Li，Z.C.，Hamilton-Jacobi-Bellman方程的径向基配置法，Automatica，42，12，2201-2207（2006）·Zbl 1104.49024号
[22]	赖，M.J。；Schumaker，L.L.，三角剖分的样条函数（2007），剑桥大学出版社·Zbl 1185.41001号
[24]	Osher，S。；Fedkiw，R.，水平集方法和动态隐式曲面（2003），Springer-Verlag:Springer-Verlag纽约·Zbl 1026.76001号
[25]	Powell，W.B.，《近似动态编程：解决维度的诅咒》（2007），Wiley-Interscience·Zbl 1156.90021号
[26]	Saridis，G.N。；Lee，C.G.，可训练机械手最优控制的近似理论，IEEE系统、人与控制论汇刊，9，3152-159（1979）·Zbl 0398.49001号
[27]	Sutton，R.S。；Barto，A.G.（强化学习：简介。强化学习：导论，自适应计算和机器学习（1998），麻省理工学院出版社）
[28]	Vamvoudakis，K.G。；Lewis，F.L.，最优控制的在线同步策略迭代方法，（智能控制系统的最新进展（2009）），357-374
[29]	Vamvoudakis，K.G。；Lewis，F.L.，解决连续时间无限时域最优控制问题的在线actor-critic算法，Automatica，46，5，878-888（2010）·Zbl 1191.49038号
[30]	王，S。；詹宁斯，L.S。；Teo，K.L.，用逆风有限体积法求解Hamilton-Jacobi-Bellman方程，全球优化杂志，27，2-3177-192（2003）·Zbl 1047.49026号
[31]	Wang，F。；张，H。；Liu，D.，《自适应动态编程：简介》（IEEE计算智能杂志（2009）），第39-47页

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

用多元\（B\）样条解含时HJB方程的一种稀疏配置方法。（英语） Zbl 1297.49053号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

用多元\（B\）样条解含时HJB方程的一种稀疏配置方法。 （英语） Zbl 1297.49053号

MSC公司：

关键词：

软件：

参考文献：

用多元\（B\）样条解含时HJB方程的一种稀疏配置方法。（英语） Zbl 1297.49053号