×

半结构网格上显著优化的并行运输扫掠。 (英语) Zbl 07504707号

摘要:我们已经在二维和三维笛卡尔几何中的一类网格上找到了可证明的最佳全域离散有序传输扫描算法,这些网格在粗糙级别上是规则的,但在粗糙块中是任意的。我们描述了这些算法,并表明它们总是在给定的(P_x倍P_y倍P_z)分区中以尽可能少的阶段数执行完整的八分位(如果是2D,则为四象限)扫描。计算结果证实,我们的最优调度算法以尽可能少的阶段数执行扫描。观察到的并行效率与我们的性能模型非常吻合。我们的PDT传输代码在仅有三个能量组、每个八分位10个方向和4096个单元/线程的简单弱标度问题上,相对于8个线程,使用\(>1.5M)并行线程实现了大约68%的并行效率。我们的ARDRA代码已实现71%的效率,核心容量大于1.5 M,相对于16个核心,每八分位36个方向,48个能量组。我们在一组真实的核反应堆试验问题上用PDT证明了类似的效率,非结构化网格可以解决精细的几何细节。这些结果表明,使用超过(10^6)个并行过程可以高效地执行离散纵坐标传输扫描。

MSC公司:

92年XX月 生物学和其他自然科学
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚当斯,M.L。;Larsen,E.W.,离散有序粒子输运计算的快速迭代方法,Prog。编号。能源,40,1,3-159(2002)
[2] 埃文斯,T.M。;斯塔福德,A.S。;Slaybaugh,R.N。;Clarno,K.T.,Denovo,一种新的三维平行离散坐标码,Nucl。技术。,171, 171-200 (2010)
[3] 泽尔,R.J。;Azmy,Y.Y.,大规模并行体系结构上群内多维离散坐标传输方程的解,Trans。美国编号。Soc.,105,429(2011年)
[4] 亚当斯,M.P。;亚当斯,M.L。;McGraw,C.N。;直到,A.T。;Bailey,T.S。;Falgout,R.D.,具有非相邻分区的显著最佳并行传输扫描,(数学与计算、核应用中的超级计算和蒙特卡罗方法联合国际会议。数学与计算联合国际会议、核应用的超级计算与蒙特卡罗法,纳什维尔,4月19日至23日,CD-ROM(2015))
[5] 亚当斯,M.P。;亚当斯,M.L。;霍金斯,W.D。;史密斯,T。;劳希沃格,L。;新墨西哥州阿马托。;Bailey,T.S。;Falgout,R.D.,《规则网格上显著优化的并行传输扫描》,(核科学与工程应用数学和计算方法国际会议论文集)。程序。核科学与工程应用数学和计算方法国际会议,美国爱达荷州太阳谷,5月5日至9日,CD-ROM(2013))
[6] 贝克·R·S。;Koch,K.R.,大规模并行CM-200计算机的Sn算法,Nucl。科学。工程,128,312(1998)
[7] 多尔,M.R。;Still,C.H.,三维多群离散坐标中子输运方程解中的并发源迭代,Nucl。科学。工程,122,3,287-308(1996)
[8] 康普顿,J.C。;Clouse,C.J.,AMTRAN中空间分解的平铺模型,(《俄罗斯-美国计算数学/物理五实验室联合会议论文集》,俄罗斯-美国五实验室联合计算数学/物理学会议论文集,奥地利维也纳,6月19-23日,CD-ROM(2005))
[9] Pautz,S.D.,非结构化网格上的并行S_n扫描算法,Nucl。科学。工程,140,111(2002)
[10] Bailey,T.S。;Falgout,R.D.,《带碰撞的大规模并行离散阶传输扫描算法分析》,(《国际数学、计算方法和反应堆物理会议论文集》,《国际数学会议论文集、计算方法与反应堆物理会议文献集》,萨拉托加斯普林斯,5月3-7日,CDROM(2009))
[11] Daryl Hawkins,W。;史密斯,蒂姆;亚当斯,迈克尔·P。;劳伦斯·劳奇沃格;南希·M·阿马托。;Marvin L.Adams,《高效大规模并行运输清扫》,Trans。美国编号。Soc.,107,477-481(2012年)
[12] Buss Harshvardan,A。;帕帕佐普洛斯,I。;皮尔斯,O。;史密斯,T。;Tanase,G。;N.托马斯。;Xu,X。;Bianco,M。;新墨西哥州阿马托。;Rauchwerger,L.,STAPL:标准模板自适应并行库,(SYSTOR.SYSTOR,以色列海法,2010年6月4-6日,ACM),1-10
[13] Tanase,G。;巴斯,A。;Fidel Harshvardan,A。;帕帕佐普洛斯,I。;皮尔斯,O。;史密斯,T。;N.托马斯。;苏,X。;莫拉德,N。;Vu,J。;Bianco,M。;新墨西哥州阿马托。;Rauchwerger,L.,《STAPL并行容器框架》(Proc.ACM SIGPLAN Symp.Prin.Prac.Par.Prog..Proc.ACM-SIGPLAN Symp.Prin.Prac.Prog.,PPOPP(2011))
[14] 巴斯,A。;Fidel Harshvardan,A。;史密斯,T。;Tanase,G。;N.托马斯。;Xu,X。;Bianco,M。;新墨西哥州阿马托。;Rauchwerger,L.,《STAPL pView》(LCPC.LCPC,休斯顿,2010年10月7-9日(2010))
[15] 哈什瓦尔丹;菲德尔。;新墨西哥州阿马托。;Rauchwerger,L.,《STAPL并行图库》(语言上的Wkshp.和语言上Par.Comp.的Wkshb.以及语言上Par Comp.的Comp.,LCPC,日本东京(2012年9月))
[16] 哈什瓦尔丹;菲德尔。;新墨西哥州阿马托。;Rauchwerger,L.,KLA:并行图计算的新算法范式,(第23届并行体系结构与编译国际会议论文集(2014)),27-36
[17] 帕帕佐普洛斯,I。;托马斯,N。;菲德尔,A。;新墨西哥州阿马托。;Rauchwerger,L.,STAPL-RTS:一个应用驱动的运行时系统,(第29届ACM超级计算国际会议(2015)的会议记录),425-434
[18] Zandifar,M。;阿卜杜勒·贾巴尔(Abdul Jabbar,M.)。;马吉迪,A。;凯斯,D。;新墨西哥州阿马托。;Rauchwerger,L.,《构建算法骨架以表达高性能科学应用》(第29届ACM超级计算国际会议论文集(2015)),415-424
[19] 帕帕佐普洛斯,I。;N.托马斯。;菲德尔。;Hoxha,D。;新墨西哥州阿马托。;Rauchwerger,L.,《分布式内存中动态应用程序的异步嵌套并行》,(Shen,X.;Mueller,F.;Tuck,J.,《并行计算的语言和编译器》,并行计算语言和编译器,LCPC 2015。并行计算语言和编译器。并行计算的语言和编译器,LCPC 2015,计算机科学讲义,第9519卷(2016),Springer:Springer-Cham)
[20] 菲德尔。;萨比多,F.C。;里德尔,C。;新墨西哥州阿马托。;Rauchwerger,L.,《使用有界异步在未加权图中快速近似距离查询》,(Ding,C.;Criswell,J.;Wu,P.,《并行计算的语言和编译器》,并行计算语言和编译器,LCPC 2016。并行计算语言和编译器。并行计算的语言和编译器,LCPC 2016,计算机科学讲义,第10136卷(2017),Springer:Springer-Cham)
[21] (链接于2019年3月测试)
[22] 斯通,H.G。;Adams,M.L.,《应用于粒子输运的分段线性有限元基础》,(《核数学和计算科学国际会议论文集》,田纳西州加特林堡,2003年4月6日至10日)
[23] Bailey,T.S。;亚当斯,M.L。;杨,B。;Zika,M.R.,任意多面体网格扩散方程的分段线性有限元离散,J.Compute。物理。,227, 3738-3757 (2008) ·Zbl 1142.65077号
[24] Godfrey,A.T.,《VERA核心物理基准进展问题规范》(2014),橡树岭国家实验室,CASL-U-2012-0131-004,第4版
[25] Childs,H。;布鲁格,E。;惠特洛克,B。;梅雷迪斯,J。;埃亨,S。;Pugmire,D。;比亚加斯,K。;米勒,M。;哈里森,C。;韦伯,G.H。;Krishnan,H。;Fogal,T。;Sanderson,A。;加思,C。;Bethel,E.W。;D.坎普。;俄·吕贝尔。;杜兰特,M。;法夫尔,J.M。;Navrátil,P.,《VisIt:可视化和分析超大数据的最终用户工具》(High Performance Visualization-Enabling Extreme-Scale Scientific Insight,2012),第357-372页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。