×

线性时不变动力系统Galerkin模型降阶的计算界公式。 (英语) Zbl 1506.74436号

摘要:本文旨在提出线性时不变(LTI)动力系统基于投影的降阶模型(ROM)的计算方法。对于此类系统,当前的实践依赖于将状态表示为秩-1张量(即向量)的ROM公式,从而产生内存带宽受限的计算内核,因此不适合现代架构上的可伸缩性能。在处理多个查询研究时,这个弱点可能特别有限,因为在这些研究中需要运行大量模拟。这项工作介绍了LTI动力系统的伽辽金ROM的一种重新表述,称为秩-2伽辽金,它将ROM问题的性质从内存带宽转换为计算边界。我们介绍了该公式及其实现的细节,并通过数值实验证明了其实用性,该实验使用轴对称域中弹性地震剪切波的模拟作为测试案例。我们量化和分析不同线程数量和问题大小的性能和缩放结果。最后,我们展示了使用等级2 Galerkin ROM进行蒙特卡罗抽样研究的端到端演示。我们表明,秩-2 Galerkin ROM比秩-1 GalerkinROM(当前实践)效率高一个数量级,比全阶模型效率高约970倍,同时保持场的平均值和统计值的准确性。

MSC公司:

74S05号 有限元方法在固体力学问题中的应用
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
第74L05页 地球物理固体力学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 本纳,P。;古吉丁,S。;Willcox,K.,参数动力系统基于投影的模型简化方法综述,SIAM Rev.,57,4,483-531(2015)·Zbl 1339.37089号
[2] 美国鲍尔。;本纳,P。;Feng,L.,线性和非线性系统的模型降阶:系统理论视角,Arch。计算。方法工程,21,4,331-358(2014)·Zbl 1348.93075号
[3] Moore,B.,《线性系统的主成分分析:可控性、可观测性和模型简化》,IEEE Trans。自动化。控制,26,1,17-32(1981)·Zbl 0464.93022号
[4] Willcox,K。;Peraire,J.,通过适当的正交分解进行平衡模型简化,AIAA J.,40,11,2323-2330(2002)
[5] Mullis,C.T。;Roberts,R.A.,最小舍入噪声定点数字滤波器的合成,IEEE Trans。电路系统。,23, 9, 551-562 (1976) ·Zbl 0342.93066号
[6] 拉尔,S。;Marsden,J.E。;ski,S.G.,受控非线性系统的经验模型简化,IFAC Proc。第32卷,第2卷,第2598-2603页(1999年),第14届国际会计师联合会1999年世界大会,中国北京,7月5-9日
[7] 古吉丁,S。;安托拉斯,A。;比蒂,C.,(mathcal{H} _2\)大型线性动力系统的模型简化,SIAM J.矩阵分析。申请。,30, 2, 609-638 (2008) ·Zbl 1159.93318号
[8] Wilson,D.,模型简化问题的最优解,Proc。仪表电气。工程师,117,61161-1165(1970)
[9] Hyland,D。;Bernstein,D.,《模型简化的最佳投影方程以及Wilson、Skelton和Moore方法之间的关系》,IEEE Trans。自动化。控制,30,12,1201-1211(1985)·Zbl 0583.93004号
[10] 拉尔,S。;Krysl等人。;Marsden,J.E.,机械系统的结构保持模型简化,Physica D,184,1304-318(2003),物理系统中的复杂性和非线性-纪念Alan Newell的特刊,URLhttp://www.sciencedirect.com/science/article/pii/S0167278903002276 ·Zbl 1041.70011号
[11] 本纳,P。;Saak,J。;Uddin,M.M.,大型稀疏二阶指数-1系统的保结构模型降阶及其在机电一体化模型中的应用,数学。计算。模型。动态。系统。,22,60509-523(2016),网址arXiv:https://doi.org/10.1080/13873954.2016.1218347 ·Zbl 1348.93025号
[12] 布丹,T。;Willcox,K。;Ghattas,O.,非定常气动应用概率分析的参数降阶模型,AIAA J.,46,10,2520-2529(2008)
[13] Grepl,医学硕士。;Patera,A.T.,参数化抛物型偏微分方程降基近似的后验误差界,ESAIM:M2AN,39,1,157-181(2005)·Zbl 1079.65096号
[14] Prud'Homme,C。;罗瓦斯,D。;Veroy,K。;机械,L。;Maday,Y。;Patera,A。;Turinici,G.,参数化偏微分方程的可靠实时解:缩减基输出界方法,J.Fluids Eng.,124,1,70-80(2001)
[15] 罗瓦斯,D。;机械,L。;Maday,Y.,抛物线问题的缩减基输出界方法,IMA J.Numer。分析。,26, 423-445 (2006) ·Zbl 1101.65099号
[16] Rovas,D.V.,参数化偏微分方程的缩减基输出界方法(2003),麻省理工学院,URLhttp://hdl.handle.net/1721.1/16956
[17] 库尼施,K。;Volkwein,S.,Galerkin抛物问题的本征正交分解方法,数值。数学。,90, 1, 117-148 (2001) ·Zbl 1005.65112号
[18] Singler,J.R.,抛物线偏微分方程降阶模型的新POD误差表达式、误差界和渐近结果,SIAM J.Numer。分析。,52, 2, 852-876 (2014) ·Zbl 1298.65140号
[19] Volkwein,S.,使用适当的正交分解进行模型简化,2011年。康斯坦茨大学讲义,www.math.uni-Konstanz.de/numberik/perseen/volkwein/taching/POD-vollesung.pdf。参数化pdes的简化27 andrea manzoni CMCS-建模与科学,(CMCS-模型与科学计算MATHICSE-计算科学与工程数学研究所EPFL-Ecole Polytechnology Fédérale de Lousanne Station 8,CH-1015 Lausanne Switzerland和MOX-Modellistica E Calcolo Scientifico Dipart(2012))
[20] 古吉丁,S。;Antoulas,A.C.,通过平衡截断进行模型简化的调查和一些新结果,国际。J.Control,77,8,748-766(2004),网址arXiv:https://doi.org/10.1080/00207170410001713448 ·兹比尔1061.93022
[21] Carter Edwards,H。;Trott,C.R。;Sunderland,D.,Kokkos,J.平行分布计算。,74, 12, 3202-3216 (2014)
[22] Dowell,E.(《气动弹性现代课程:气动弹性、固体力学及其应用的现代课程》(2015),斯普林格国际出版公司)·Zbl 1297.74001号
[23] Meirovitch,L.,《振动基础》(2010),Waveland出版社
[24] 戈曼,M。;Khrabrov,A.,高攻角下飞机空气动力学特性的状态空间表示,J.Aircr。,31, 5, 1109-1115 (1994)
[25] 巴齐列夫斯,Y。;徐,M.-C。;Scott,M.,等几何流体-结构相互作用分析,重点是非匹配离散化,并应用于风力涡轮机,计算。方法应用。机械。工程,249,28-41(2012)·Zbl 1348.74094号
[26] 博格,M。;Collu,M.,海上浮动垂直轴风力涡轮机气动载荷的频域特性,应用。能源,155629-636(2015)·Zbl 1353.70004号
[27] Incorpera,F.P。;Lavine,A.S。;Bergman,T.L。;DeWitt,D.P.,《传热传质基础》(2007),威利
[28] 赵,C。;Lu,T.,《电子冷却用微通道散热器的分析》,《国际传热传质杂志》,45,24,4857-4869(2002)·Zbl 1032.76680号
[29] 班纳吉,S。;Mukhopadhyay,A。;Sen,S。;Ganguly,R.,电子冷却用方形和浅形外壳中的热磁对流,数值。传热A部分,55,10,931-951(2009)
[30] Epting,J.,《城市地下资源的热管理——边界条件的划定》,《Procedia Eng.》,209,83-91(2017),《城市地下水——从地球科学与工程到空间规划与管理》
[31] 沙阿·R·K。;Sekulic,D.P.,《换热器设计基础》(2003),John Wiley&Sons
[32] 刘易斯,E.E。;Miller,W.F.,中子输运计算方法(1984),网址https://www.osi.gov/biblio/5538794 ·Zbl 0594.65096号
[33] Tencer,J。;卡尔伯格,K。;拉森,M。;Hogan,R.,通过模型简化对灰色吸收发射介质的玻尔兹曼输运方程离散纵坐标近似的加速解,J.Heat Transfer,139,12(2017)
[34] Lighthill,M.J.,《关于空气动力学产生的声音I.一般理论》,Proc。R.Soc.A,211,1107,564-587(1952年)·Zbl 0049.25905号
[35] Ffowcs Williams,J.E。;霍金斯,D.L.,湍流和表面在任意运动中产生的声音,Proc。R.Soc.A,2641151321-342(1969)·Zbl 0182.59205号
[36] Phillips,O.M.,《关于超音速湍流剪切层产生声音的研究》,J.流体力学。,9,1,1-28(1960年)·Zbl 0097.41502号
[37] O.伦巴第。;巴里埃,C。;Leroy,V.,泡沫层对声波的非线性多次散射,Europhys。莱特。,112224002(2015年)
[38] 弗拉赫,J。;基尼,V。;Singhal,K.,《电路分析和设计的计算机方法》(1983),Springer Science&Business Media
[39] Chetty,P.,电流注入等效电路法,用于非连续电感传导模式下开关DC-DC转换器的建模,IEEE Trans。Ind.Electron公司。,3, 230-234 (1982)
[40] Chen,Z.,使用定向结模拟耦合噪声的线性电路模型组合,(IEEE第14届电子封装电气性能专题会议,2005(2005)),83-86
[41] Sirovich,L.,湍流与相干结构动力学,第一部分:相干结构,夸特。申请。数学。,45、3、561-571(1987),网址http://www.jstor.org/stable/43637457 ·Zbl 0676.76047号
[42] Berkooz,G。;霍姆斯,P。;Lumley,J.L.,湍流分析中的适当正交分解,Annu。Rev.流体机械。,25, 1, 539-575 (1993)
[43] 哈奇森,A。;Natoli,V.,《内存限制与计算限制:高性能应用中缓存和内存带宽的定量研究》(2011年),URLhttp://docplayer.net/33565764-Memory-bound-vs-compute-bound-a-quantitative-study-of-cache-and-Memory-bandwidth-in-high-performance-applications.html
[44] 袁,D。;Wang,J。;Johnsson,L。;Chi,C.-H。;Shi,Y.,GPU科学与工程多尺度问题解决方案(2011),斯普林格出版公司。
[45] 埃拉弗洛,A。;古马斯,G。;Koziris,N.,Intel Xeon Phi上稀疏矩阵向量乘法的性能分析与优化,(2017 IEEE国际并行与分布式处理研讨会研讨会,2017 IEEE International Parallel and Distributed Processing Symposium Workshops,IPDPSW(2017)),1389-1398
[46] Yang,H。;Gunzburger,M.,《使用并行降阶建模降低涡扇发动机噪声的随机优化算法和分析》,计算。方法应用。机械。工程,319217-239(2017)·Zbl 1439.76136号
[47] 贝尔,N。;Garland,M.,《关于CUDANVIDIA技术报告的高效稀疏矩阵向量乘法》(2008),NVIDIA Corporation,URLhttps://www.nvidia.com/docs/IO/66889/nvr-2008-004.pdf
[48] Peise,E.,稠密线性代数的性能建模和预测(2017),URL arXiv:1706.01341
[49] 艾哈迈德,K。;文卡特,A。;Hall,M.,《优化LOBPCG:稀疏矩阵循环和实际数据转换》,(Ding,C.;Criswell,J.;Wu,P.,《并行计算的语言和编译器》(2017),Springer International Publishing:Springer国际出版公司Cham),218-232
[50] C.洪。;苏库马拉·拉贾姆,A。;Bandyopadhyay,B。;Kim,J。;科特,S.E。;尼萨,I。;萨卜洛克,S。;弗吉尼亚州圣塔雷克。;Parthasarathy,S。;Sadayappan,P.,《GPU上的高效稀疏矩阵多矢量积》,(第27届高性能并行和分布式计算国际研讨会论文集,第27届高效并行和分布式计算机国际会议论文集,HPDC’18(2018),计算机械协会:美国纽约州纽约市计算机械协会),66-79
[51] 蒋,N。;Layton,W.,流动集合的快速计算算法,国际不确定性杂志。数量。,4, 4, 273-301 (2014) ·Zbl 1301.65099号
[52] Gunzburger,M。;蒋,N。;Schneier,M.,非平稳Navier-Stokes方程的集合-固有正交分解方法,SIAM J.Numer。分析。,55, 1, 286-304 (2017) ·Zbl 1394.76067号
[53] Gunzburger,M。;蒋,N。;Wang,Z.,一种模拟参数化流问题集合的有效算法,IMA J.Numer。分析。,39, 3, 1180-1205 (2018) ·Zbl 1466.65133号
[54] Phipps,E。;D'Elia,M。;爱德华兹,H.C。;霍姆曼,M。;胡,J。;Rajamanickam,S.,《嵌入式集成传播用于提高新兴计算架构不确定性量化的性能、可移植性和可扩展性》(2015),URL arXiv:1511.03703·Zbl 1365.65017号
[55] 伊格尔,H。;Weber,M.,SH-使用高阶有限差分在整个地幔中传播,Geophys。Res.Lett.公司。,22, 6, 731-734 (1995)
[56] 扬克,G。;索恩,M.S。;科查德,A。;Igel,H.,使用平行轴对称球面有限差分格式的全球SH-波传播:应用于整个地幔散射,地球物理。《国际期刊》,173,3815-826(2008)
[57] 查尔朱布,E。;Tarantola,A.,上地幔660 km不连续面上SS前兆对地形的敏感性,Geophys。Res.Lett.公司。,24, 21, 2613-2616 (1997)
[58] 王,Y。;Takenaka,H。;蒋,X。;Lei,J.,在横向非均匀全月球模型中模拟二维全球地震波传播,Geophys。《国际期刊》,192,3,1271-1287(2012)
[59] Virieux,J.,SH-波在非均匀介质中的传播:速度-应力有限差分法,Explore。地球物理学。,15, 4, 265 (1984)
[60] Virieux,J.,P-SV波在非均匀介质中的传播:速度-应力有限差分法,地球物理学,51,4,889-901(1986)
[61] 佩雷拉,V。;Kaelin,A.,通过模型降阶的快波传播,电子。事务处理。数字。分析。第30卷,406-419(2008),网址http://emis.impa.br/emis/journals/ETNA/vol.30.2008/p406-419.dir/pp406-419.pdf ·Zbl 1171.65072号
[62] Pereyra,V.,《大尺度波传播的斜投影模型降阶》,J.Compute。申请。数学。,295103-114(2016),第八届应用和计算数学泛美研讨会·Zbl 1329.86018号
[63] Dziewonski,A.M。;Anderson,D.L.,初步参考地球模型,Phys。地球行星。埋。,25, 4, 297-356 (1981)
[64] Kennett,B.法律公告。;Engdahl,E.R。;Buland,R.,《旅行时间对地球地震速度的限制》,地球物理学。《国际期刊》,122,1,108-124(1995)
[65] 蒙塔格纳,J.-P。;Kennett,B.法律公告,《如何协调体波和正常模式参考地球模型》,Geophys。《国际期刊》,125,1,229-248(1996)
[66] Rabinovich,E。;菲利彭科,纽约。;Shefel,G.S.,地震脉冲的广义模型,J.Phys。Conf.序列号。,1015,第052025条pp.(2018)
[67] Van Zee,F.G。;van de Geijn,R.A.,BLIS:快速实例化BLAS功能的框架,ACM Trans。数学。软件,41,3,14:1-14:33(2015)·Zbl 1347.65054号
[68] Van Zee,F.G。;史密斯,T。;伊古尔,F.D。;Smelyanskiy,M。;张,X。;Kistler,M。;奥斯特,V。;Gunnels,J。;低,T.M。;标记,B。;基洛,L。;van de Geijn,R.A.,BLIS框架:可移植性实验,ACM Trans。数学。软件,42,2,12:1-12:19(2016)
[69] 李,A。;Hammad Mazhar,R.S。;Negrut,D.,使用CUSP、cuSPARSE和ViennaCL对不同矩阵格式的矩阵进行SPMV性能比较(2015),URLhttps://sbel.wiscweb.wisc.edu/wp-content/uploads/sites/569/2018/05/TR-2015-02.pdf
[70] 瑞士R。;Kramer,B。;黄,C。;Willcox,K.,《学习单喷射器燃烧过程的基于物理的降阶模型》,AIAA J.,58,6,2658-2672(2020)
[71] 《线性代数手册》(2006),CRC出版社:CRC出版社,美国佛罗里达州博卡拉顿
[72] I.卡拉什尼科娃,S.Arunajatesan,M.F.Barone,B.G.van Bloemen Waanders,J.A.Fike,大系统预测和控制的降阶建模,http://dx.doi.org/10.2172/1177206。 ·Zbl 1296.93165号
[73] Amsallem,D。;Tezaur,R。;Farhat,C.,使用具有任意底层网格的参数化降阶模型数据库实时求解线性计算问题,J.Compute。物理。,326, 373-397 (2016) ·Zbl 1373.68446号
[74] 阿芙拉,S。;Gildin,E.,基于张量的高阶奇异值分解地质储层参数化,计算。地质科学。,94, 110-120 (2016)
[75] Shi,Y。;尼兰詹,联合国。;Anandkumar,A。;Cecka,C.,CPU和GPU上扩展BLAS内核的张量收缩,(2016 IEEE第23届高性能计算国际会议,2016 IEEE高性能计算第23届国际会议,HiPC(2016)),193-202
[76] 阿卜杜勒法塔赫,A。;海达尔,A。;托莫夫,S。;Dongarra,J.,《用于GPU的分批GEMM的性能、设计和自动调整》,(Kunkel,J.M.;Balaji,P.;Dongarla,J.《高性能计算》(2016),Springer International Publishing:Springer国际出版公司Cham),21-38
[77] 李,X。;梁,Y。;Yan,S。;贾,L。;Li,Y.,GPU上高效GEMM的协调平铺和批处理框架,(第24届并行编程原理与实践研讨会论文集。第24届平行编程原理与实务研讨会论文集,PPoPP’19(2019),计算机械协会:美国纽约州纽约市计算机械协会),229-241
[78] 江,L。;杨,C。;Ma,W.,在SW26010多核处理器上实现高效的批量矩阵乘法,ACM Trans。阿基特。代码优化。,17, 1 (2020)
[79] 马尔基迪斯,S。;Chien,S.W.D。;Laure,E。;彭,I.B。;Vetter,J.S.,NVIDIA Tensor核心可编程性、性能精度,(2018 IEEE国际并行和分布式处理研讨会研讨会,2018 IEEE International Parallel and Distributed Processing Symposium Workshops,IPDPSW(2018)),522-531
[80] Jouppi,N.P。;Young,C。;帕蒂尔,N。;帕特森,D。;阿格拉瓦尔,G。;巴伊瓦,R。;贝茨,S。;巴蒂亚,S。;博登,N。;Borchers,A。;博伊尔,R。;坎廷,P.-l。;Chao,C.等人。;克拉克,C。;Coriell,J。;Daley,M。;Dau,M。;迪安·J。;盖尔布,B。;加埃玛格哈米,T.V。;Gottipati,R。;古兰,W。;哈格曼,R。;Ho,C.R。;霍格伯格博士。;胡,J。;Hundt,R。;赫特,D。;伊巴兹,J。;A.杰菲。;Jaworski,A。;卡普兰,A。;Khaitan,H。;基列布雷,D。;科赫公司。;库马尔,N。;莱西,S。;Laudon,J。;法律,J。;勒·D。;Leary,C。;刘,Z。;幸运,K。;伦丁,A。;MacKean,G。;Maggiore,A。;Mahony,M。;Miller,K。;Nagarajan,R。;Narayanaswami,R。;镍,R。;尼克斯,K。;诺丽,T。;奥默尼克,M。;Penukonda,N。;Phelps,A。;罗斯,J。;罗斯,M。;Salek,A。;Samadiani,E。;塞文,C。;西齐科夫,G。;斯内勒姆,M。;苏特,J。;斯坦伯格,D。;摆动,A。;Tan,M。;Thorson,G.公司。;田,B。;托马,H。;Tuttle,E。;瓦苏德万,V。;沃尔特·R。;Wang,W。;威尔科克斯,E。;Yoon,D.H.,张量处理单元的In-datacenter性能分析,(第44届国际计算机体系结构研讨会论文集。第44届计算机体系结构国际研讨会论文集,ISCA’17(2017),计算机械协会:计算机械协会,纽约,美国),1-12
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。