×

随机最优控制中出现的有理Riccati方程的同伦。 (英语) Zbl 1325.65064号

摘要:我们考虑了(mathbb{R}^n)中有理代数Riccati方程的数值解,该方程是由连续和离散时间的随机最优控制引起的。应用同伦方法,我们继续从确定性代数Riccati方程的稳定解出发,这些稳定解很容易获得。相关的微分方程需要一些广义Lyapunov或Stein方程的解,这些方程可以用广义Smith方法求解,具有\(O(n^3)\)计算复杂性和\(O(n^2)\)记忆要求。对于大规模问题,相关矩阵的稀疏性和结构进一步提高了算法的效率。相比之下,替代(修改)牛顿方法需要一个困难的初始稳定步骤。提供了一些说明性的数值示例。

MSC公司:

65楼30 其他矩阵算法(MSC2010)
60 H10型 随机常微分方程(随机分析方面)
60华氏35 随机方程的计算方法(随机分析方面)
93E20型 最优随机控制
15A24号 矩阵方程和恒等式
第34页 常微分方程和随机系统
65H20个 全局方法,包括非线性方程数值解的同伦方法
93E03型 控制理论中的随机系统(一般)
65层10 线性系统的迭代数值方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] H.Abou-Kandil、G.Freiling、V.Ionescu和G.Jank,{控制和系统理论中的矩阵Riccati方程},Birkha用户Verlag,巴塞尔,2003年·Zbl 1027.93001号
[2] B.D.O.Anderson和J.B.Moore,{线性最优控制},普伦蒂斯·霍尔,恩格尔伍德克利夫斯,新泽西州,1971年·Zbl 0321.49001号
[3] B.D.O.Anderson和J.B.Moore,{最佳过滤},普伦蒂斯·霍尔,恩格尔伍德克利夫斯,新泽西州,1979年·Zbl 0688.93058号
[4] M.Athan和P.L.Falb,《最优控制:理论及其应用导论》,麦格劳-希尔出版社,纽约,1965年。
[5] P.Benner和T.Breiten,{一类广义Lyapunov方程的低秩方法及相关问题},Numer。数学。,124(2013),第441-470页·Zbl 1266.65068号
[6] P.Benner和T.Damm,{it-Lyapunov方程,能量泛函,双线性和随机系统的模型降阶},SIAM J.控制优化。,49(2011),第686-711页·Zbl 1217.93158号
[7] P.Benner和H.Fassbender,{关于大型稀疏离散Riccati方程的数值解},高级计算。数学。,35(2011),第119-147页·Zbl 1230.65070号
[8] P.Benner、A.Laub和V.Mehrmann,《代数Riccati方程数值解的基准》,IEEE控制系统。Mag.,17(1995),第18-28页。
[9] P.Bender、J.-R.Li和T.Pension,{大规模Lyapunov方程、Riccati方程和线性二次控制问题的数值解},Numer。线性代数应用。,15(2008),第755-777页·兹比尔1212.65245
[10] P.Benner和J.Saak,{求解大尺度代数Riccati方程的Galerkin-Newton-ADI方法},预印SPP1253-090,DFG优先计划12532010。
[11] P.Benner和J.Saak,《钢型材优化冷却的半离散传热模型》,载于《大尺度系统降维》,P.Benler、V.Mehrmann和D.C.Sorensen编辑,Lect。注释计算。科学。Eng.45,Springer-Verlag,柏林,2005年,第353-356页·Zbl 1170.80341号
[12] P.Benner和J.Saak,{大尺度代数Riccati方程的Newton-Galerkin-ADI方法},《应用线性代数学报》2010年,http://ala2010.pmf.uns.ac.rs/presentations/4g1220pb.pdf。
[13] D.A.Bini、B.Iannazzo和B.Meini,《代数Riccati方程的数值解》,SIAM,费城,2012年·Zbl 1244.65058号
[14] {\lang1033C.Y.Chiang、H.-Y.Fan和W.-W.Lin,{\lang1033\sit具有奇异控制加权矩阵的离散时间代数Riccati方程的结构化加倍算法},Taiwan J.Maths。,14(2010年),第933-954页·Zbl 1206.65169号
[15] 朱永康,范洪云,林永伟,{连续时间代数Riccati方程的一种结构保护加倍算法},线性代数应用。,396(2005),第55-80页·Zbl 1151.93340号
[16] E.K.-W.Chu,H.-Y.Fan,W.-W.Lin,and C.-S.Wang,{it周期离散代数Riccati方程的结构保护加倍算法},国际。《控制杂志》,77(2004),第767-788页·Zbl 1061.93061号
[17] E.K.-W.Chu,T.Li,W.-W.Lin,和C.-Y.Weng,{关于随机控制中产生的有理Riccati方程的修正牛顿法},IEEE-CCCA'11会议录,突尼斯哈马马特,2011;内政部10.1109/CCCA.2011.6031219。
[18] T.Damm,《随机控制中的有理矩阵方程》,《控制与信息》讲义。科学。297,施普林格·弗拉格,柏林,2004年·Zbl 1034.93001号
[19] T.Damm,{\it-广义Lyapunov方程的直接方法和ADI-预条件Krylov子空间方法},Numer。线性代数应用。,15(2008),第853-871页·Zbl 1212.65175号
[20] T.Damm和D.Hinrichsen,{随机控制中有理矩阵方程的牛顿法},线性代数应用。,332-334(2001),第81-109页·Zbl 0982.65050号
[21] V.Dragan,T.Morozan和A.-M.Stoica,《离散时间线性随机系统鲁棒控制中的数学方法》,Springer,纽约,2010年·Zbl 1183.93001号
[22] 范洪云,翁振源,朱永康,{随机控制中广义Lyapunov/Stein方程和有理Riccati方程的Smith方法},技术报告,国立清华大学NCTS,台湾新竹,2013;也可从以下网址在线获取http://www.math.cts.nthu.edu.tw/publish/publishe.php?class=102。
[23] A.Ferrante和L.Ntogramatzidis,{it离散广义代数和差分Riccati方程}的约简技术,线性多线性代数,即将出现;内政部10.1080/03081087.2013.834056·兹比尔1302.93058
[24] A.Ferrante和L.Ntogramatzidis,{广义连续代数Riccati方程和无脉冲连续时间LQ最优控制},Automatica,50(2014),第1176-1180页·Zbl 1421.49030号
[25] G.Freiling,{非对称Riccati方程综述},线性代数应用。,351-352(2002),第243-270页·Zbl 1008.34004号
[26] G.Freiling和A.Hochhaus,{\it有理矩阵差分方程解的性质},Comput。数学。申请。,45(2003),第1137-1154页·Zbl 1055.39033号
[27] G.Freiling和A.Hochhaus,{关于随机控制中产生的一类有理矩阵微分方程},线性代数应用。,379(2004),第43-68页·Zbl 1070.34054号
[28] G.H.Golub和C.F.Van Loan,《矩阵计算》,第三版,约翰霍普金斯大学出版社,马里兰州巴尔的摩,1996年·Zbl 0865.65009号
[29] 郭春华,{随机控制中矩阵Riccati方程的迭代解},Oper。理论高级应用。,130(2001),第209-221页·Zbl 1020.65024号
[30] C.-H.Guo和A.J.Laub,{求解代数Riccati方程的Schur方法},IEEE Trans。自动垫。《控制》(1979),第913-921页·Zbl 0424.65013号
[31] M.Heyouni和K.Jbilou,{it连续时间代数Riccati方程大规模解的扩展块Arnoldi算法},Electron。事务处理。数字。分析。,33(2009年),第53-62页·Zbl 1171.65035号
[32] I.G.Ivanov,{求解随机控制中产生的有理Riccati方程的迭代},计算。数学。申请。,53(2007年),第977-988页·Zbl 1127.65025号
[33] I.G.Ivanov,{求解一般Riccati方程的Stein(Lyapunov)迭代的性质},非线性分析。,67(2007),第1155-1166页·Zbl 1122.65041号
[34] I.M.Jaimoukha和E.M.Kasenaly,解大型Lyapunov方程的{it-Krylov子空间方法},SIAM J.Numer。分析。,31(1994年),第227-251页·Zbl 0798.65060号
[35] K.Jbilou,{大型连续时间代数Riccati方程的块Krylov子空间方法},Numer。《算法》,34(2003),第339-353页·Zbl 1045.65036号
[36] K.Jbilou,{it大型代数Riccati方程的基于Arnoldi的算法},应用。数学。莱特。,19(2006年),第437-444页·Zbl 1094.65038号
[37] K.Jbilou,大型Sylvester矩阵方程的低阶近似解,Appl。数学。计算。,177(2006),第365-376页·Zbl 1095.65041号
[38] R.E.Kalman,《线性滤波和预测问题的新方法》,《基础工程杂志》(ASME),82D(1960),第35-45页。
[39] R.E.Kalman,《对最优控制理论的贡献》,Bol。墨西哥国家材料协会,5(1960),第102-119页·Zbl 0112.06303号
[40] D.Kleinman,《关于Riccati方程计算的迭代技术》,IEEE Trans。自动垫。控制,13(1968),第114-115页。
[41] P.Lancaster和L.Rodman,{代数Riccati方程},克拉伦登出版社,英国牛津,1995年·Zbl 0836.15005号
[42] T.Li,E.K.-W.Chu,W.-W.Lin,C.Y.Weng,{通过加倍求解大规模连续时间代数Riccati方程},J.Compute。申请。数学。,237(2013),第373-383页·Zbl 1253.65063号
[43] 李振东,郭永昌,朱永康,林永伟,{用加倍法求解大尺度离散时间代数Riccati方程},技术报告,国立清华大学,台湾新竹,2012;也可从以下网址在线获取http://www.math.cts.nthu.edu.tw/publish/publishe.php?class=102。
[44] T.Li,P.C.-Y.Weng,E.K.-W.Chu,和W.-W.Lin,{大尺度Stein和Lyapunov方程,Smith方法和应用},Numer。《代数》,63(2013),第727-752页·兹比尔1271.65079
[46] V.L.Mehrmann,{自治线性二次控制问题},控制与信息讲义。科学。163,柏林斯普林格-Verlag,1991年·Zbl 0746.93001号
[47] K.Morris和C.Navasc,{偏微分方程控制中产生的代数Riccati方程的解},《控制与边界分析》,《纯粹与应用》讲义。数学。240,查普曼和霍尔/CRC,佛罗里达州博卡拉顿,2005年,第257-280页·Zbl 1097.65057号
[48] L.S.Pontryagin、V.G.Boltyanskii、R.V.Gamkrelidze和E.F.Mishchenko,《优化过程的数学理论》,John Wiley,纽约,1962年·兹伯利0102.32001
[49] I.G.Rosen和C.Wang,{算子Lyapunov和代数Riccati方程近似解的多级技术},SIAM J.Numer。分析。,32(1995年),第514-541页·Zbl 0857.65047号
[50] H.Schneider,{正算子和惯性定理},Numer。数学。,7(1965年),第11-17页·Zbl 0158.28003号
[51] 翁振源,范洪源,朱永康,{输运理论中非对称代数Riccati方程解的Low-rank近似},应用。数学。计算。,219(2012),第729-740页·Zbl 1302.65110号
[52] W.M.Wonham,《关于随机控制的矩阵Riccati方程》,SIAM J.control,6(1968),第681-797页·Zbl 0182.20803号
[53] W.M.Wonham,{线性多变量控制},Springer-Verlag,柏林,1970年·Zbl 0314.93008号
[54] L.Zhang,H.Y.Fan,E.K.-W.Chu,Y.Wei,{随机控制中有理Riccati方程的同伦},技术报告,NCTS,国立清华大学,台湾新竹,2013;也可从以下网址在线获取http://www.math.cts.nthu.edu.tw/publish/publishe.php?class=102。
[55] K.Zhou和J.C.Doyle,《鲁棒控制要点》,Prentice Hall,Englewood Cliffs,NJ,1998年·Zbl 0890.93003号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。