×

兹马思-数学第一资源

变系数Helmholtz问题高阶精确解技术的并行共享内存实现。(英语) Zbl 1443.65387
摘要:最近发展起来的层次Poincaré-Steklov(HPS)方法是一种高阶离散化技术,它带有直接求解器。以往文献的结果表明,该方法能够在不产生所谓污染效应的情况下,高精度地求解亥姆霍兹问题。虽然直接求解器的计算量的渐近标度与嵌套剖分法相同,但求解技术的串行实现不适用于大规模数值模拟。本文介绍了HPS方法的第一个并行实现。具体地说,我们介绍了一种利用并行线性代数实现求解技术的共享内存的方法。这种方法是未来在具有大内存节点的超级计算机和集群上进行大规模仿真的基础。在桌面计算机(类似于大内存节点)上给出了性能结果。
理学硕士:
65号35 偏微分方程边值问题的谱、配点及相关方法
6505年 并行数值计算
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Gillman,A.;Barnett,A.;Martinsson,P.,《可变介质频域散射问题的光谱精确直接求解技术》(BIT Numer)。数学,55,1141-170(2015)·Zbl 1312.65201
[2] 马丁森,P.G.,变系数椭圆型偏微分方程的直接求解法,J。计算机。物理学,242460-479(2013)·Zbl 1297.65169
[3] Babb,T.;Gillman,A.;Hao,S.;Martinsson,P.G.,基于多域谱离散化的加速泊松解算器,位编号。数学,58,4851-879(2018)·Zbl 1405.65156号
[4] Trefethen,L.,MATLAB中的光谱方法(2000),暹罗·Zbl 0953.68643
[5] Gillman,A.;Martinsson,P.,《通过高阶复合谱配置方法离散的变系数椭圆偏微分方程的具有(O(N)复杂性的直接解算器》,暹罗J.Sci。计算机,36,4,A2023-A2046(2014)·Zbl 1303.65099
[6] Geldermans,P.;Gillman,A.,《椭圆边值问题的自适应高阶直接解技术》,暹罗J.Sci。计算机,41,1,A292-A315(2019年)·Zbl 07010373
[7] George,A.,规则有限元网格的嵌套剖分,暹罗J.Numer。《分析》,10345-363(1973年)·中银0259.65087
[8] Duff,I.S.;Erisman,A.M.;Reid,J.K.,《稀疏矩阵的直接方法》(1989),牛津·中保0666.65024
[9] Wilson,E.L.,静态压缩算法,国际互联网。J、 数字。方法工程,8,1198-203(1974)
[10] Xia,J.;Chandrasekaran,S.;Gu,M.;Li,X.S.,大型结构化线性方程组的超快速多前沿方法,SIAM J.《矩阵分析》。申请书,31,3,1382-1411(2009年)·Zbl 1195.65031
[11] Gillman,A.,椭圆偏微分方程快速直接求解器(2011),科罗拉多大学博尔德分校,应用数学,(博士论文)
[12] Born,S.L.;Grasedyck,L.;Kriemann,R.,《基于区域分解的\(\mathcal{H}\)-lu预处理程序》,(Widlund,O.B.;Keyes,D.E.,《科学与工程中的区域分解方法》第十六卷,第55卷(2007年),斯普林格-柏林-海德堡:斯普林格-柏林-海德堡-柏林,海德堡),667-674
[13] 马丁森,P.G.,一类椭圆型偏微分方程的快速直接求解器,科学与工程学报。计算机,38,3,316-330(2009年)·Zbl 1203.65066
[14] Schmitz,P.;Ying,L.,二维一般网格上椭圆问题的快速直接求解器,J.Comput。物理学,231,41314-1338(2012年)·Zbl 1408.65022
[15] 十、 Li,J.Demmel,J.Gilbert,L.Grigori,M.Shao,I.Yamazaki,SuperLU用户指南,技术代表LBNL-44289,劳伦斯伯克利国家实验室,http://crd.lbl.gov/xiaoye/SuperLU/。上次更新:2011年8月(1999年9月)。
[16] Demmel,J.W.;Gilbert,J.R.;Li,X.S.,稀疏高斯消去的异步并行超节点算法,SIAM J.矩阵分析。申请书,204915-952(1999)·Zbl 0939.65036
[17] 十、 李国明,邓明明,超逻辑距离:非对称线性系统的可扩展分布式内存稀疏直接求解器,计算机辅助制造技术。数学。软。29(2)110-140。·Zbl 1068.90591
[18] Gupta,A.,共享和分布式内存并行通用稀疏直接求解器,应用。代数工程公社。计算机,18,3,263-277(2007年)·Zbl 1122.65030
[19] Amestoy,P.R.;Duff,I.S.;L'Excellent,J.-Y.;Koster,J.,《使用分布式动态调度的全异步多面解算器》,SIAM J.《矩阵分析》。申请书,23,1,15-41(2001)·Zbl 0992.65018
[20] Amestoy,P.R.;Guermouche,A.;L'Excellent,J.-Y.;Pralet,S.,线性系统并行解决方案的混合调度,并行计算,32,2,136-156(2006),并行矩阵算法与应用(PMAA'04)
[21] Rouet,F.-H.;Li,X.S.;Ghysels,P.;Napov,A.,《使用随机化实现密集分层半可分矩阵计算的分布式内存包》,ACM Trans。数学。软件,42,4,27:1-27:35(2016),http://doi.acm.org/10.1145/2930660·Zbl 1369.65043
[22] S、 Williams,A.Waterman,D.Patterson,Roofline:浮点程序和多核架构的有洞察力的视觉性能模型,技术代表,劳伦斯伯克利国家实验室(LBNL),加州伯克利(美国)2009年。
[23] Ilic,A.;Pratas,F.;Sousa,L.,《缓存感知屋顶线模型:升级阁楼》,IEEE Comput。阿奇。Lett.,13,1,21-24(2014年)
[24] 英特尔,英特尔顾问。网址https://software.intel.com/en-us/advisor。
[25] T、 Koskela,pyAdvisor,网址https://github.com/tkoskela/pyAdvisor。
[26] Sheng,Z.;Dewilde,P.;Chandrasekaran,S.,《求解分层半可分系统的算法》,(系统理论,Schur算法和多维分析)。系统理论,舒尔算法和多维分析,操作。理论高级。应用,第176卷(2007年),Birkhäuser:Birkhäuser Basel),255-294·Zbl 1123.65020
[27] Chandrasekaran,S.;Gu,M.,对称块对角加半可分矩阵特征分解的分而治之算法。数学,96,4723-731(2004)·Zbl 1047.65023
[28] Hackbusch,W.,基于H-矩阵的稀疏矩阵算法;第一部分:H-矩阵导论,计算,62,89-108(1999)·Zbl 0927.65063
[29] Grasedyck,L.;Hackbusch,W.,\(\mathcal{H}\)-矩阵的构造和算法,计算,704295-334(2003)·Zbl 1030.65033
[30] Gillman,A.;Young,P.;Martinsson,P.,《一维区域上积分方程具有\(O(N)\)复杂度的直接求解器》,前沿。数学。中国,7,2,217-247(2012年)·Zbl 1262.65198
[31] S、 Ambikasaran,E.Darve,部分分层半可分矩阵的快速直接求解器,科学与工程学报。计算机。57(3)477-501。·Zbl 1292.65030
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。