×

高维Hamilton-Jacobi-Bellman方程的张量分解方法。 (英语) Zbl 1471.65184号

作者提出了求解非线性动力系统最优反馈控制中产生的高维全非线性Hamilton-Jacobi-Bellman方程的数值方法。该算法将连续策略迭代与值函数的TT(张量-应变)分析相结合。研究了一类最优控制问题的辨识问题,其中值函数可以用低秩TT结构精确表示。作者采用的方法将值函数的张量列近似与求解所得非线性系统的类牛顿迭代方法相结合。张量近似导致了关于维数的多项式缩放,部分绕过了维数的诅咒。对线性二次型情形进行了收敛性分析。对于非线性动力学,在具有一百个变量的Allen-Cahn和Fokker-Planck方程的最优反馈镇定中评估了高维控制综合方法的有效性。作者采用的基于谱近似和张量演算的方法为新的误差分析开辟了可能性。

MSC公司:

65N22型 含偏微分方程边值问题离散方程的数值解
65H10型 方程组解的数值计算
65层10 线性系统的迭代数值方法
15A23型 矩阵的因式分解
15A69号 多线性代数,张量演算
49J20型 偏微分方程最优控制问题的存在性理论
93B52号 反馈控制
90立方厘米 动态编程
93年第35季度 与控制和优化相关的偏微分方程
84年第35季度 福克-普朗克方程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] M.Akian、S.Gaubert和A.Lakhoua,求解确定性最优控制问题的max-plus有限元方法:基本性质和收敛性分析,SIAM J.control Optim。,47(2008),第817-848页,https://doi.org/10.1137/060655286。 ·Zbl 1157.49034号
[2] G.Albi、Y.-P.Choi、M.Fornasier和D.Kalise,平均场控制层次,应用。数学。最佳。,76(2017),第93-135页,https://doi.org/10.1007/s00245-017-9429-x。 ·Zbl 1378.49024号
[3] A.Alla、M.Falcone和D.Kalise,动态规划方程的有效策略迭代算法,SIAM J.Sci。计算。,37(2015),第A181-A200页,https://doi.org/10.1137/130932284。 ·Zbl 1327.65259号
[4] A.Alla、M.Falcone和L.Saluzzi,有限时域最优控制问题树结构上的高效DP算法,SIAM J.Sci。计算。,41(2019),第A2384-A2406页,https://doi.org/10.1137/18M1203900。 ·Zbl 1423.49024号
[5] A.Alla、M.Falcone和S.Volkwein,通过动态规划方法对无限时域问题的POD近似进行误差分析,SIAM J.控制优化。,55(2017),第3091-3115页,https://doi.org/10.1137/15M1039596。 ·Zbl 1378.49025号
[6] J.I.Alora、A.Gorodetsky、S.Karaman、Y.Marzouk和N.Lowry,使用张量-应变分解从sc-LTL规范自动合成低阶控制系统,收录于2016年IEEE第55届决策与控制会议(CDC),IEEE,2016年,第1131-1138页。
[7] M.Annunziato和A.Borz,随机系统的Fokker-Planck控制框架,EMS Surv。数学。科学。,5(2018),第65-98页·Zbl 1406.93383号
[8] R.W.Beard、G.N.Saridis和J.T.Wen,广义Hamilton-Jacobi-Bellman方程的Galerkin近似,Automatica J.IFAC,33(1997),第2159-2177页,https://doi.org/10.1016/S0005-1098(97)00128-3·Zbl 0949.93022号
[9] R.Bellman,《动态规划理论中的函数方程》。V.正性和拟线性,Proc。国家。阿卡德。科学。美国,41(1955),第743-746页,https://doi.org/10.1073/pnas.41.10.743。 ·Zbl 0066.13802号
[10] P.Benner和T.Damm,Lyapunov方程,能量泛函,双线性和随机系统的模型降阶,SIAM J.控制优化。,49(2011),第686-711页,https://doi.org/10.1137/09075041X。 ·Zbl 1217.93158号
[11] D.P.Bertsekas,《强化学习与最优控制》,雅典娜科学出版社,马萨诸塞州贝尔蒙特,2019年。
[12] G.Beylkin和M.J.Mohlenkamp,《高维数值算子微积分》,Proc。国家。阿卡德。科学。美国,99(2002),第10246-10251页,https://doi.org/10.1073/pnas.112329799。 ·Zbl 1008.65026号
[13] J.-M.Biannic和J.Boada-Bauxel,民用飞机着陆挑战,https://w3.onera.fr/smac/sites/w3.onena.fr.smac/files/CALC_v2.pdf, 2016.
[14] O.Bokanowski、J.Garcke、M.Griebel和I.Klompmaker,一阶Hamilton-Jacobi-Bellman方程的自适应稀疏网格半拉格朗日格式,科学杂志。计算。,55(2013),第575-605页,https://doi.org/10.1007/s10915-012-9648-x。 ·Zbl 1269.65076号
[15] T.Breiten、K.Kunisch和L.Pfeiffer,无限高阶双线性最优控制问题:灵敏度分析和多项式反馈律,SIAM J.控制优化。,56(2018),第3184-3214页,https://doi.org/10.1137/18M1173952。 ·兹比尔1401.49004
[16] T.Breiten、K.Kunisch和L.Pfeiffer,双线性控制问题多项式反馈律的数值研究,数学。控制关系。Fields,8(2018),第557-582页,https://doi.org/10.3934/mcrf.2018023。 ·Zbl 1418.49002号
[17] Y.T.Chow、J.Darbon、S.Osher和W.Yin,克服状态相关Hamilton-Jacobi方程维数灾难的算法,J.Compute。物理。,387(2019),第376-409页,https://doi.org/10.1016/j.jcp.2019.01.051。 ·Zbl 1452.49016号
[18] M.G.Crandall和P.L.Lions,Hamilton-Jacobi方程解的两个近似,数学。压缩机。,43(1984),第1-19页,https://doi.org/10.2307/2007396。 ·Zbl 0556.65076号
[19] A.Dektor和D.Venturi,高维非线性偏微分方程的动态正交张量方法,J.Comput。物理。,404 (2020), 109125, https://doi.org/https://doi.org/10.1016/j.jcp.2019.109125。 ·Zbl 1453.65280号
[20] S.Dolgov和B.Khoromskij,优化张量演算的两级QTT-Tucker格式,SIAM J.矩阵分析。申请。,34(2013),第593-623页,https://doi.org/10.1137/120882597。 ·Zbl 1273.65169号
[21] S.V.Dolgov和D.V.Savostyanov,高维线性系统的交替最小能量方法,SIAM J.Sci。计算。,36(2014),第A2248-A2271页,https://doi.org/10.1137/10953289。 ·Zbl 1307.65035号
[22] W.E、J.Han和A.Jentzen,基于深度学习的高维抛物型偏微分方程和倒向随机微分方程数值方法,Commun。数学。Stat.,5(2017),第349-380页,https://doi.org/10.1007/s40304-017-0117-6。 ·Zbl 1382.65016号
[23] Y.Eidelman和I.Gohberg,关于一类新的结构矩阵,积分方程算子理论,34(1999),第293-324页,https://doi.org/10.1007/BF01300581。 ·Zbl 0934.15002号
[24] M.Falcone和R.Ferretti,Hamilton-Jacobi型方程的数值方法,摘自《hY方程数值方法手册》,Handb。数字。分析。17,Elsevier/North-Holland,阿姆斯特丹,2016年,第603-626页·Zbl 1352.65001号
[25] J.Garcke和A.Kroöner,通过在自适应稀疏网格上求解HJB方程实现PDE的次优反馈控制,J.Sci。计算。,70(2017),第1-28页,https://doi.org/10.1007/s10915-016-0240-7。 ·兹比尔1434.49020
[26] S.A.Goreinov、I.V.Oseledets、D.V.Savostyanov、E.E.Tyrtyshnikov和N.L.Zamarashkin,《如何找到一个好的子矩阵》,《矩阵方法:理论、算法、应用》,V.Olshevsky和E.Tyrtyshnikov编辑,《世界科学》,新泽西州哈肯萨克,2010年,第247-256页·Zbl 1215.65078号
[27] A.Gorodetsky、S.Karaman和Y.Marzouk,使用连续张量分解的高维随机最优控制,国际机器人杂志。第37号决议(2018年),第340-377页。
[28] L.Grasedyck,张量积结构中大系统低Kronecker-rank近似的存在与计算,《计算》,72(2004),第247-265页·兹比尔1058.65036
[29] W.Hackbusch,基于矩阵的稀疏矩阵算法。第一部分:矩阵导论,计算,62(1999),第89-108页,https://doi.org/10.1007/s006070050015。 ·Zbl 0927.65063号
[30] W.Hackbusch,张量空间和数值张量微积分,Springer-Verlag,柏林,2012年·兹比尔1244.65061
[31] J.Han、A.Jentzen和W.E,使用深度学习求解高维偏微分方程,Proc。国家。阿卡德。科学。美国,115(2018),第8505-8510页,https://doi.org/10.1073/pnas.1718942115。 ·Zbl 1416.35137号
[32] C.Hartmann,B.Schaõfer Bung和A.Thoõns Zueva,双线性系统的平衡平均及其在随机控制中的应用,SIAM J.control Optim。,51(2013),第2356-2378页,https://doi.org/10.1137/100796844。 ·Zbl 1273.35273号
[33] S.Holtz、T.Rohwedder和R.Schneider,张量列格式张量优化的交替线性方案,SIAM J.Sci。计算。,34(2012),第A683-A713页,https://doi.org/10.1137/100818893。 ·Zbl 1252.15031号
[34] M.B.Horowitz、A.Damle和J.W.Burdick,《高维线性Hamilton-Jacobi-Bellman方程》,《第53届IEEE决策与控制会议论文集》,IEEE,2014年,第5880-5887页。
[35] C.Hureí,H.Pham和X.Warin,《高维非线性偏微分方程的深后向格式》,数学。压缩机。,89(2020年),第1547-1579页·Zbl 1440.60063号
[36] M.Hutzenthaler、A.Jentzen、T.Kruse、T.Anh Nguyen和P.von Wurstemberger,克服半线性抛物型偏微分方程数值逼近中的维数灾难,Proc。R.Soc.伦敦。序列号。数学。物理学。工程科学。,476 (2020), 20190630, https://doi.org/10.1098/rspa.2019.0630。 ·Zbl 1455.65200元
[37] D.Kalise和A.Kroöner,通过动态规划实现对流-作用-扩散系统的降阶最小时间控制,《第21届网络与系统数学理论国际研讨会论文集》(2014),第1196-1202页。
[38] D.Kalise、S.Kundu和K.Kunisch,通过高维Hamilton-Jacobi-Isaacs方程的数值逼近实现非线性偏微分方程的鲁棒反馈控制,SIAM。J.应用。动态。系统。,19(2020),第1496-1524页,https://doi.org/10.1137/19M1262139。 ·Zbl 1443.49041号
[39] D.Kalise和K.Kunisch,高维Hamilton-Jacobi-Bellman方程的多项式逼近及其在半线性抛物型偏微分方程反馈控制中的应用,SIAM J.Sci。计算。,40(2018年),第A629-A652页,https://doi.org/10.1137/17M1116635。 ·Zbl 1385.49022号
[40] W.Kang和L.C.Wilcox,缓解维度诅咒:最优反馈控制的稀疏网格特征方法和HJB方程,Comput。最佳方案。申请。,68(2017),第289-315页,https://doi.org/10.1007/s10589-017-9910-0。 ·Zbl 1383.49045号
[41] B.N.Khoromskij,多维偏微分方程的张量数值方法:理论分析和初步应用,载于CEMRACS 2013-复杂系统建模与仿真:随机和确定性方法,ESAIM Proc。调查48,EDP科学。,Les Ulis,2015年,第1-28页,https://doi.org/10.1051/proc/201448001。 ·Zbl 1382.65461号
[42] T.G.Kolda和B.W.Bader,张量分解和应用,SIAM Rev.,51(2009),第455-500页,https://doi.org/10.1137/07070111X。 ·Zbl 1173.65029号
[43] K.Kunisch、S.Volkwein和L.Xie,基于HJB-POD的进化问题最优控制反馈设计,SIAM J.Appl。动态。系统。,3(2004)第701-722页,https://doi.org/10.1137/030600485。 ·Zbl 1058.35061号
[44] K.Kunisch和D.Walter,通过深度神经网络近似实现自治系统的半全局最优反馈镇定,ESAIM:COCV,27(2021),16,https://doi.org/10.1051/cocv/202109。 ·Zbl 1511.49021号
[45] S.E.Lyshevski,非线性连续时间系统的最优控制:通过广义非二次泛函设计有界控制器,《1998年美国控制会议论文集》,ACC,第1卷,IEEE,1998年,第205-209页。
[46] B.J.Matkowsky和Z.Schuss,Fokker-Planck算子的特征值和势场扩散的平衡方法,SIAM J.Appl。数学。,40(1981),第242-254页,https://doi.org/10.1137/014020。 ·Zbl 0477.60057号
[47] W.M.McEneaney,解某些HJB偏微分方程的无诅咒维数值方法,SIAM J.Control Optim。,46(2007),第1239-1276页,https://doi.org/10.1137/040610830。 ·Zbl 1251.65168号
[48] T.Nakamura-Zimmerer、Q.Gong和W.Kang,高维Hamilton-Jacobi-Bellman方程的自适应深度学习,预印本,http://arxiv.org/abs/1907.05317, 2019.
[49] M.Neilan、A.J.Salgado和W.Zhang,强非线性偏微分方程的数值分析,Acta Numer。,26(2017),第137-303页,https://doi.org/10.1017/S0962492917000071。 ·Zbl 1381.65092号
[50] I.V.Oseledets,张量-应变分解,SIAM J.Sci。计算。,33(2011),第2295-2317页,https://doi.org/10.1137/090752286。 ·Zbl 1232.15018号
[51] I.V.Oseledets,低秩张量格式函数的构造表示,Constr。约,37(2013),第1-18页,https://doi.org/10.1007/s00365-012-9175-x。 ·Zbl 1282.15021号
[52] I.V.Oseledets和E.E.Trytyshnikov,多维数组的TT-交叉近似,线性代数应用。,432(2010),第70-88页,https://doi.org/10.1016/j.laa.2009.07.024。 ·Zbl 1183.65040号
[53] M.Oster、L.Sallandt和R.Schneider,用层次张量积逼近定态Hamilton-Jacobi-Bellman方程,预印本,网址:http://arxiv.org/abs/1111.00279, 2019.
[54] M.L.Puterman和S.L.Brumelle,关于平稳动态规划中策略迭代的收敛性,数学。操作。Res.,4(1979),第60-69页,https://doi.org/10.1287/moor.4.1.60。 ·兹比尔0411.90072
[55] M.Raissi和G.E.Karniadakis,《隐藏物理模型:非线性偏微分方程的机器学习》,J.Compute。物理。,357(2018),第125-141页,https://doi.org/10.1016/j.jcp.2017.11.039。 ·Zbl 1381.68248号
[56] C.Reisinger和Y.Zhang,校正深度神经网络克服非线性刚性系统零和博弈中非光滑值函数的维数灾难,分析与应用,18(2020),pp.951-999·Zbl 1456.82804号
[57] D.V.Savostyanov,张量最大体积交叉插值的拟最优性,线性代数应用。,458(2014),第217-244页,https://doi.org/10.1016/j.laa.2014.06.006。 ·Zbl 1294.65017号
[58] R.Schneider和A.Uschmajew,周期Sobolev空间中层次张量格式的近似速率,《复杂性杂志》,30(2014),第56-71页,https://doi.org/10.1016/j.jco.2013.10.001 . ·Zbl 1329.41033号
[59] J.Sirignano和K.Spiliopoulos,DGM:解偏微分方程的深度学习算法,J.Compute。物理。,375(2018),第1339-1364页,https://doi.org/10.1016/j.jcp.2018.08.029。 ·Zbl 1416.65394号
[60] E.D.Sontag,《数学控制理论》,第二版,《确定性有限维系统的文本》。申请。数学。6,Springer-Verlag,纽约,1998年,https://doi.org/10.1007/978-1-4612-0577-7, ·Zbl 0945.93001号
[61] L.P.Tobias Breiten,Karl Kunisch,利用值函数逼近实现二维Navier-Stokes方程的反馈镇定,应用。数学。最佳。,80(2019年),第599-641页·Zbl 1425.35135号
[62] E.Todorov,最优行动的有效计算,Proc。国家。阿卡德。科学。美国,106(2009),第11478-11483页·Zbl 1203.68327号
[63] L.N.Trefethen,MATLAB中的光谱方法,SIAM,费城,2000年,https://doi.org/10.1137/1.978089878719598。 ·Zbl 0953.68643号
[64] E.E.Tyrtyshnikov,由渐近光滑函数生成的矩阵的张量近似,Sb.数学。,194(2003),第941-954页,https://doi.org/10.1070/SM2003v194n06ABEH000747。 ·Zbl 1067.65044号
[65] J.G.Verwer和J.M.Sanz-Serna,偏微分方程线性近似法的收敛性,计算,33(1984),第297-313页,https://doi.org/10.1007/BF02242274。 ·Zbl 0546.65064号
[66] I.Yegorov和P.M.Dower,《基于特征的无诅咒多维数值方法解决哈密顿-雅可比方程的观点》,应用。数学。最佳。,83(2021),第1-49页·Zbl 1461.49028号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。