×

应用于微分矩阵方程的分裂格式的GPU加速。 (英语) Zbl 1441.65057号

本文讨论了一般形式(dot{P}=a^{mathsf{T}}P+PA+Q+G(P))的矩阵微分Lyapunov和Riccati型方程分裂格式的并行GPU实现。比较了基于Leja点插值的不同分裂方案变体(Lie和Strang分裂),以计算矩阵指数作用。在这个方案中,原始问题被分为较简单的子问题(\dot{P}=F_1(P))和(\dot{P}=F_2(P)。为了能够对大规模设置进行有效的计算,假设\(P\)表现出低秩结构。所考虑的方法在MATLAB中实现,通过NVIDIA的CUDA库利用其内置GPU支持。目前的工作只考虑自治案例;因此,可以避免因时间依赖而产生的代价高昂的重新计算。
为了测试所提出的方法,我们考虑了四个不同的数值例子。对于其中两个示例,与Matlab例程获得的解相比,实验收敛结果代码15已报告。对于剩下的两个示例,问题规模增加了,并提供了自收敛结果(即,在更精细的分辨率水平上,针对使用相同方法计算的解决方案的收敛)。通过比较GPU实现和CPU版本,完成了性能分析。加速比在\(3倍)和\(10倍)之间(取决于矩阵大小)。

MSC公司:

65升05 常微分方程初值问题的数值方法
65层60 矩阵指数和相似矩阵函数的数值计算
65年20月 数值算法的复杂性和性能
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abou-Kandil,H。;Freiling,G。;伊奥内斯库,V。;Jank,G.,《控制和系统理论中的矩阵Riccati方程》(2003),巴塞尔:Birkhäuser,巴塞尔·Zbl 1027.93001号
[2] 阿隆索·马洛,I。;卡诺,B。;Reguera,N.,用指数分裂方法积分扩散反应边值问题时避免降阶,J.Compute。申请。数学。,357, 228-250 (2019) ·Zbl 1457.65079号 ·doi:10.1016/j.cam.2019.02.023
[3] 安托拉斯,Ac;Sorensen博士;周瑜,关于Hankel奇异值的衰减率及其相关问题。续租约。,46, 5, 323-342 (2002) ·Zbl 1003.93024号 ·doi:10.1016/S0167-6911(02)00147-0
[4] 奥尔,N。;Einkemmer,L。;坎多夫,P。;Ostermann,A.,多核CPU和GPU上的Magnus积分器,Comput。物理学。通信,228115-122(2018)·doi:10.1016/j.cpc.2018.02.019
[5] Auzinger,W。;科赫,O。;Thalhammer,M.,涉及三个线性算子的高阶分裂方法的基于缺陷的局部误差估计,Numer。算法。,70, 1, 61-91 (2015) ·Zbl 1325.65131号 ·doi:10.1007/s11075-014-9935-8
[6] 塔梅尔·巴沙尔;Bernhard,Pierre,H∞-最优控制和相关的最小最大设计问题(2008),马萨诸塞州波士顿:Birkhäuser Boston,Boston·Zbl 1130.93002号
[7] 贝克,J。;恩布里,M。;Sabino,J.,具有非正态系数的Lyapunov解的快速奇异值衰减。SIAM,J.矩阵分析。申请。,36, 2, 656-668 (2015) ·Zbl 1320.15011号 ·数字对象标识代码:10.1137/140993867
[8] Bell,N.,Garland,M.:CUDA上的高效稀疏矩阵向量乘法。NVIDIA公司技术报告NVR-2008-004(2008)
[9] 本纳,P。;Breiten,T.,一类广义Lyapunov方程的低秩方法及其相关问题,Numer。数学。,124, 3, 441-470 (2013) ·Zbl 1266.65068号 ·doi:10.1007/s00211-013-0521-0
[10] 本纳,P。;Damm,T.,Lyapunov方程,能量泛函,双线性和随机系统的模型降阶。SIAM,J.控制优化。,49, 2, 686-711 (2011) ·Zbl 1217.93158号 ·数字对象标识码:10.1137/09075041X
[11] 彼得·本纳(Peter Benner);埃内斯托·杜弗雷丘(Ernesto Dufrechou);巴勃罗·埃扎蒂;赫尔曼·梅纳;恩里克·S·金塔纳·奥尔蒂。;Remón,Alfredo,在混合CPU-GPU平台上求解稀疏微分Riccati方程,计算科学及其应用-ICCSA 2017,116-132(2017),Cham:Springer International Publishing,Cham
[12] Benner,P.、Ezzatti,P.,Mena,H.、Quintana-Ortyí,E.S.、Remón,A.:在多GPU平台上求解微分Riccati方程。摘自:《第11届科学与工程计算与数学方法国际会议论文集》,第178-188页。CMMSE’11,贝尼多姆(2011)
[13] 本纳,P。;埃扎蒂,P。;Mena,H。;昆塔纳-奥尔蒂,Es;Remón,A.,《在多核和多核架构上求解矩阵方程》,《算法》,6,4,857-870(2013)·Zbl 1461.65061号 ·doi:10.3390/a6040857
[14] 本纳,P。;Mena,H.,Rosenbrock解Riccati微分方程的方法,IEEE Trans。自动化。控制,58,11,2950-2956(2013)·Zbl 1369.65088号 ·doi:10.1109/TAC.2013.2258495
[15] 本纳,P。;Mena,H.,无限维LQR问题和相关Riccati微分方程的数值解,J.Numer。数学。,26, 1, 1-20 (2018) ·Zbl 1444.65032号 ·doi:10.1515/jnma-2016-1039
[16] Caragiannis,Ioannis;迈克尔·亚历山大;罗莎·玛丽亚,巴迪亚;马里奥·卡纳塔罗;亚历山大·科斯坦;马可·丹拉托托;弗雷德里克·德斯普雷兹;贝蒂娜·克拉默;朱利奥·萨胡基略(Julio Sahuquillo);斯蒂芬·斯科特(Stephen L.Scott)。;Josef Weidendorfer,Euro-Par 2012:平行加工车间(2013),柏林,海德堡:施普林格柏林-海德堡,柏林
[17] Benner,P.,Saak,J.:钢型材最佳冷却的半离散传热模型。In:Benner,P.,Mehrmann,V.,Sorensen,D.(编辑)《大尺度系统的降维》,Lect。注释计算。科学。工程10.1007/3-540-27909-1_1910.1007/3-540.27909-1_19,第45卷,第353-356页。柏林施普林格出版社(2005)·Zbl 1170.80341号
[18] 卡利亚里,M。;坎多夫,P。;奥斯特曼,A。;Rainer,S.,计算矩阵指数作用的软件比较,BIT Numer。数学。,54, 1, 113-128 (2014) ·Zbl 1290.65042号 ·doi:10.1007/s10543-013-0446-0
[19] 卡利亚里,M。;坎多夫,P。;奥斯特曼,A。;Rainer,S.,重温Leja方法:矩阵指数的向后误差分析。SIAM,J.科学。计算。,38、3、A1639-A1661(2016)·Zbl 1339.65061号
[20] Damm,T.,Mena,H.,Stillfjord,T.:有限时域随机线性二次控制问题的数值解。数字。线性代数。申请。(2017) ·Zbl 1424.49037号
[21] De Leo先生。;里亚尔,D。;Sánchez De La Vega,C.,《不可逆方程的高阶时间分裂方法》,IMA,J.Numer。分析。,36, 4, 1842-1866 (2016) ·Zbl 1433.65098号 ·doi:10.1093/imanum/drv058
[22] Einkemmer,L.,Ostermann,A.:图形处理单元上的指数积分器。摘自:2013年高性能计算模拟国际会议(HPCS),第490-496页。10.1109/HPCSim.2013.6641458(2013)
[23] Einkemmer,L。;Ostermann,A.,《克服扩散反应分裂中的阶数减少》。第1部分:Dirichlet边界条件,SIAM J.Sci。计算。,37、3、A1577-A1592(2015)·Zbl 1433.65189号 ·数字对象标识代码:10.1137/140994204
[24] Einkemmer,L。;Ostermann,A.,《克服扩散反应分裂中的阶数减少》。第2部分:倾斜边界条件,SIAM J.Sci。计算。,38、6、A3741-A3757(2016)·Zbl 1355.65121号 ·doi:10.137/16M1056250
[25] 我,法夸尔;Tj莫罗尼;杨琼。;Turner,Iw,用于计算矩阵函数向量积的GPU加速算法,应用于指数积分器和分数扩散,SIAM J.Sci。计算。,38、3、C127-C149(2016)·Zbl 1382.65124号 ·数字对象标识代码:10.1137/15M1021672
[26] Goumas,G.,Kourtis,K.,Anastopoulos,N.,Karakasis,V.,Koziris,N.:了解稀疏矩阵向量乘法的性能。摘自:第16届并行、分布式和基于网络的处理欧洲微观会议(PDP 2008),第283-292页。10.1109/PDP.2008.41(2008)
[27] Hansen,E。;Ostermann,A.,存在解析半群的高阶分裂方法,BIT Numer。数学。,49, 3, 527-542 (2009) ·Zbl 1176.65066号 ·doi:10.1007/s10543-009-0236-x
[28] Hansen,E。;Stillfjord,T.,抽象微分Riccati方程分裂的收敛性分析,SIAM J.Numer。分析。,52, 6, 3128-3139 (2014) ·Zbl 1405.65082号 ·doi:10.1137/130935501
[29] Hundsdorfer,W。;Verwer,J.,计算数学中随时间变化的对流-扩散-反应方程的数值解,第33卷(2003),柏林:Springer,柏林·兹比尔1030.65100
[30] 一川,A。;Katayama,H.,关于时变(H_{infty}H_)∞Riccati方程的注记,系统。续租约。,37, 5, 335-345 (1999) ·Zbl 1050.93507号 ·doi:10.1016/S0167-6911(99)00041-9
[31] Koskela,A.,Mena,H.:大尺度微分Riccati方程的Krylov子空间近似分析。arXiv:http://arXiv.org/abs/1705.07507 (2017) ·Zbl 1456.65019号
[32] Lang,N.,《大型线性时变控制系统和相关微分矩阵方程的数值方法》(2017年),Chemnitz:论文,Technische Universityät Chemnitz,Chennitz
[33] Lang,N。;Mena,H。;Saak,J.,《关于LDLT因式分解对大规模微分矩阵方程求解器的益处》,《线性代数应用》。,480,44-71(2015)·Zbl 1320.65110号 ·doi:10.1016/j.laa.2015.04.006
[34] 梅纳,H。;奥斯特曼,A。;Pfurtscheller,Lm;Piazzola,C.,矩阵微分方程的数值低阶近似,J.Compute。申请。数学。,340, 602-614 (2018) ·Zbl 1432.65090号 ·doi:10.1016/j.cam.2018.01.035
[35] Mena,H。;Pfurtscheller,L.,《厄尔尼诺的有效SPDE方法》,应用。数学。计算。,352, 146-156 (2019) ·Zbl 1503.65096号 ·doi:10.1016/j.cam.2018.11.023
[36] Nakatsukasa,Y.,欧氏度量中广义特征值问题的Gerschgorin定理,数学。公司。,80, 276, 2127-2142 (2011) ·Zbl 1230.15012号 ·doi:10.1090/S0025-5718-2011-02482-8
[37] Nickolls,J。;巴克,I。;加兰,M。;Skadron,K.,《使用CUDA的可扩展并行编程》,Queue,6,2,40-53(2008)·doi:10.1145/1365490.1365500
[38] 宾夕法尼亚州。;Sardeshmukh,P.,热带海面温度异常的最佳增长,J.Clim。,8, 1999-2024 (1995) ·doi:10.1175/1520-0442(1995)008<1999:TOGOTS>2.0.CO;2
[39] Penzl,T.,Lyapunov方程解的特征值衰减界:对称情况,系统。续租约。,40, 139-144 (2000) ·Zbl 0977.93034号 ·doi:10.1016/S0167-6911(00)00010-4
[40] 彼得森,Ir;弗吉尼亚州乌格里诺夫斯基;Savkin,Av,使用(H^{infty}H\)∞方法的鲁棒控制设计(2000),伦敦:施普林格出版社,伦敦·Zbl 0963.93003号
[41] Reese,J。;Zaranek,S.,MATLAB中的GPU编程。Mathworks News&Notes,22-5(2012年),Natick:The Mathworks Inc,Natick
[42] Saak,J.:Effiziente numerische Lösung eines Optimalsteuerung关于Abkühlung von Stahlprofilen的问题。Diplorabeit,Fachbereich 3/Mathematik und Informatik,不来梅大学,D-28334不来梅(2003)
[43] Sorensen博士;Zhou,Y.,Lyapunov方程特征值衰减率和解的灵敏度的界。技术代表TR02-07,公司部门。申请。数学。(2002),休斯顿:休斯顿莱斯大学
[44] Stillfjord,T.,大型微分Riccati方程的低阶二阶分裂。IEEE Trans公司,Automat。控制,60,10,2791-2796(2015)·Zbl 1360.65192号 ·doi:10.10109/TAC.2015.239889
[45] Stillfjord,Tony,大规模微分Riccati方程的自适应高阶分裂格式,数值算法,78,4,1129-1151(2017)·Zbl 1404.65060号 ·doi:10.1007/s11075-017-0416-8
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。