×

一种适用于具有大量核的多核体系结构的健壮且可扩展的多级域分解预处理器。 (英语) Zbl 1503.65308号

摘要:随着高性能计算的发展,多核和多核系统是新硬件体系结构的一个共同特征。由于内核数量的增加,引入这些架构所需的编程工作具有挑战性。基于数据流模型和任务编程范式的并行编程模型旨在解决此问题。迭代线性解算器是油藏模拟的一个关键部分,因为它们可以占总计算时间的80%。在这些算法中,针对大型、稀疏和非结构化矩阵的标准预处理方法(如不完全LU分解(ILU)或代数多重网格(AMG))无法在具有大量核心的共享内存体系结构上扩展。最近引入的多级域分解(DDML)预处理器由于其并行性,在新兴的体系结构上似乎既具有数字鲁棒性,又具有可扩展性。本文提出了一种使用任务编程范式和数据流模型并行实现这些预条件的方法。该方法在从实际油藏模拟中提取的线性系统上进行了验证。这表明,在这种预条件器中给定适当的粗算子,该方法具有良好的收敛速度,而我们的实现确保了多核架构上有趣的可扩展性。

MSC公司:

65号55 多重网格方法;含偏微分方程边值问题的区域分解
65F08个 迭代方法的前置条件
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] van der Vorst,H.A.,Bi-CGSTAB:非对称线性系统解的Bi-CG的一种快速且平滑收敛的变体,SIAM J.Sci。统计计算。,13, 2, 631-644 (1992) ·Zbl 0761.65023号
[2] 萨阿德,Y。;Schultz,M.H.,GMRES:求解非对称线性系统的广义最小残差算法,SIAM J.Sci。统计计算。,7, 3, 856-869 (1986) ·Zbl 0599.65018号
[3] 巴纳德,S.T。;Bernardo,L.M。;Simon,H.D.,《t3E上SPAI预处理程序的MPI实现》,国际期刊《高性能计算》。申请。,13, 107-128 (1999)
[4] Brandt,A。;Mccormick,S.F。;Ruge,J.W.,(Evans,D.J.,《稀疏矩阵方程的代数多重网格(AMG)》(1984),剑桥大学出版社:剑桥大学出版社,纽约)·Zbl 0548.65014号
[5] 贝克,A.H。;甘布林,T。;舒尔茨,M。;Yang,U.M.,跨现代多核架构缩放代数多重网格的挑战,(并行分布式处理研讨会(IPDPS),2011 IEEE国际(2011)),275-286
[6] Park,J。;Smelyanskiy,M。;杨女士。;Mudigere,D。;Dubey,P.,为基于多核的分布式并行系统优化的高性能代数多重网格求解器,(《高性能计算、网络、存储和分析国际会议论文集》,SC'15(2015),ACM:ACM纽约,纽约,美国),54:1-54:12
[7] Dolean,V。;Jolivet,P。;Nataf,F.,《区域分解方法简介》(2015),工业和应用数学学会:工业和应用算术学会,宾夕法尼亚州费城·Zbl 1364.65277号
[8] 斯皮兰,N。;Dolean,V。;豪雷特,P。;F.纳塔夫。;佩奇斯坦,C。;Scheichl,R.,偏微分方程系统的鲁棒两级区域分解预条件,C.R.数学。,349, 23, 1255-1259 (2011) ·Zbl 1252.65201号
[9] Gratien,J.M.,异构并行体系结构的抽象面向对象运行时系统,(并行与分布式处理研讨会博士论坛(IPDPSW),2013年IEEE第27届国际会议(2013)),1203-1212
[10] Broquedis,F。;克莱特·奥尔特加,J。;Moreaud,S.等人。;Furmento,N。;戈林,B。;Mercier,G。;Thibault,S。;Namyst,R.,hwloc:管理HPC应用中硬件亲和力的通用框架,(PDP 2010-第18届并行、分布式和基于网络的计算欧洲微计算机国际会议(2010),比萨,IEEE:比萨,意大利IEEE)
[11] Saad,Y.,稀疏线性系统的迭代方法(2003),工业和应用数学学会:美国宾夕法尼亚州费城工业和应用数学学会·Zbl 1002.65042号
[12] 马格拉斯,J。;Quandalle,P。;Bia,P.,利用并行ATHOS进行高性能油藏模拟,(SPE油藏模拟研讨会(2001),石油工程师学会)
[13] 格雷森,J.-M。;Guignon,T。;马格拉斯,J.-F。;Quandalle,P。;Ricois,O.M.,并行油藏模拟中的可扩展性和负载平衡问题,(SPE油藏模拟研讨会(2007),石油工程师学会)
[14] Chow,E。;Patel,A.,《细粒度平行不完全LU因子分解》,SIAM J.Sci。计算。,37、2、C169-C193(2015)·Zbl 1320.65048号
[15] 福尔戈,R.D。;Jones,J.E。;Yang,U.M.,《并行高性能预处理器库hypre的设计与实现》(Bruaset,a.M.;Tveito,a.,《并行计算机上偏微分方程的数值解》(2006),施普林格-柏林-海德堡:施普林格–柏林-海德堡-柏林,海德堡),267-294·Zbl 1097.65059号
[16] 冯,C。;舒,S。;Yue,X.,《BoomerAMG OpenMP版本的改进》,(Zhang,Y.;Li,K.;Xiao,Z.,《高性能计算:第八届CCF会议》,2012年10月29日至31日,中国张家界,HPC 2012,第八届CIF会议,修订论文集(2013),斯普林格-柏林-海德堡:斯普林格
[17] 施瓦兹,H.A.,尤伯·埃因恩·格伦祖伯冈·杜尔赫·阿尔特尼伦德斯·弗法伦,272-286(1870)
[18] Aavatsmark,I。;Barkve,T。;博伊,Ø。;Mannseth,T.,《非均匀各向异性介质的非正交四边形网格离散化》,J.Compute。物理。,127, 1, 2-14 (1996) ·兹比尔0859.76048
[19] Eymard,R。;Guichard,C。;赫宾,R。;Masson,R.,《一般网格上多相组成Darcy流的顶点中心离散化》,计算。地质科学。,16, 4, 987-1005 (2012)
[20] Boyer,F。;休伯特,F。;Krell,S.,求解二维m-DDFV格式的非重叠Schwarz算法,IMA J.Numer。分析。,30, 4, 1062-1100 (2010) ·Zbl 1205.65297号
[21] Droniou,J。;Eymard,R。;加洛特,t。;Herbin,R.,《模拟有限差分、混合有限体积和混合有限体积方法的统一方法》,数学。模型方法应用。科学。,20, 02, 265-295 (2010) ·Zbl 1191.65142号
[22] Droniou,J。;Eymard,R。;Herbin,R.,梯度格式:扩散方程数值分析的通用工具,ESAIM数学。模型。数字。分析。,50, 3, 749-781 (2016) ·兹比尔1346.65042
[23] Guennebaud,G。;Jacob,B.,《特征v3》(2010)
[24] 克里斯蒂,M。;Blunt,M.,第十个SPE比较解决方案项目:升级技术的比较,SPE Reserve。评估。工程,4,2,308-317(2001)
[25] Jolivet,P。;Hecht,F。;纳塔夫,F。;Prud'Homme,C.,异质椭圆问题的可伸缩区域分解预条件,(SC13-高性能计算、网络、存储和分析国际会议(2013),ACM:ACM丹佛,美国),80:1-80:11
[26] Tang,J.M。;纳本,R。;Vuik,C。;Erlangga,Y.A.,从通缩、区域分解和多重网格方法导出的两级预条件的比较,J.Sci。计算。,39, 3, 340-370 (2009) ·Zbl 1203.65073号
[27] Gee,M.W。;西弗特,C.M。;胡建杰。;杜米纳罗,R.S。;Sala,M.G.,ML 5.0平滑聚合用户指南技术。Sandia国家实验室技术报告SAND2006-2649(2006)代表
[28] 布拉特,M。;Bastian,P.,迭代求解器模板库,(应用并行计算国际研讨会(2006),Springer),666-675
[29] PETSc主页(2018年)
[30] Trilinos主页(2018)
[31] Minden,V。;B.史密斯。;Knepley,M.G.,《使用GPU初步实施PETSc》(Yuen,D.A.;Wang,L.;Chi,X.;Johnsson,L.,Ge,W.;Shi,Y.,《科学与工程中多尺度问题的GPU解决方案》(2013),斯普林格·柏林-海德堡:斯普林格尔·柏林-海德堡-柏林,海德堡),131-140
[32] Kreutzer,M。;Thies,J。;Röhrig-Zöllner,M。;Pieper,A。;沙赫扎德,F。;加尔贡,M。;Basermann,A。;Fehske,H。;海格·G。;Wellein,G.,GHOST:异构系统上高性能稀疏线性代数的构建块,国际J。并行程序。,45, 5, 1046-1072 (2017)
[33] 布鲁莫夫,R.D。;Joerg,C.F。;库兹摩尔,公元前。;Leiserson,C.E。;Randall,K.H。;Zhou,Y.,Cilk:一个高效的多线程运行时系统,J.Parallel Distrib.Comput。,37, 1, 55-69 (1996)
[34] 伊瓜德,E。;巴迪亚·R·M。;Bellens,P。;Cabrera,D。;杜兰,A。;费雷尔,R。;González,M。;伊古尔,F。;吉梅内斯·冈萨雷斯(Jiménez-González),D。;拉巴塔,J。;马丁内尔。;Martorell,X。;梅奥,R。;佩雷斯,J.M。;普莱纳斯,J。;Quintana-Ortyí,E.S.,《扩展OpenMP以适应异构多核时代》,《国际并行程序》。,38, 5, 440-459 (2010) ·Zbl 1211.68109号
[35] 奥贡奈特,C。;Thibault,S。;纳米斯特,R。;Wacrenier,P.-A,StarPU:异构多核架构上任务调度的统一平台,Concurr。计算。实践。有效期:23,187-198(2011年)
[36] 利马,J.V.F。;戈蒂埃,T。;Danjean,V。;拉芬,B。;Maillard,N.,多CPU和多GPU架构调度策略的设计与分析,并行计算。,44, 37-52 (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。