×

EMPIRE-PIC:一种性能可移植的单元代码中的非结构化粒子。 (英语) Zbl 1494.78004号

摘要:在本文中,我们介绍了EMPIRE-PIC,这是桑迪亚国家实验室开发的一种有限元方法——细胞内粒子(FEM-PIC)应用。该代码是在C++中使用Trilinos库和Kokkos Performance Portability Framework开发的,可以在多个现代计算体系结构上运行,而只需要维护单个代码库。EMPIRE-PIC能够解决二维和三维的静电和电磁问题,在空间和时间上达到二阶精度。本文针对三个基准问题——简单电子轨道、静电朗缪尔波和通过等离子体传播的横电磁波——验证了代码。我们演示了EMPIRE-PIC在四种不同体系结构上的性能:Intel Haswell CPU、Intel的Xeon Phi Knights Landing、ARM Thunder-X2 CPU和连接到IBM POWER9处理器的NVIDIA Tesla V100 GPU。该分析显示了代码的可伸缩性,最高可达2000多个GPU,超过10万个CPU。

MSC公司:

78-04 光学和电磁理论相关问题的软件、源代码等
78M10个 有限元、伽辽金及相关方法在光学和电磁理论问题中的应用
78平方米20 有限差分法在光学和电磁理论问题中的应用
78M99型 光学和电磁理论问题的基本方法
78A25型 电磁理论(通用)
78A30型 静电和磁力静力学
78A35型 带电粒子的运动
78A60型 激光器、脉泽、光学双稳态、非线性光学
65M60毫米 涉及偏微分方程初值和初边值问题的有限元、Rayleigh-Ritz和Galerkin方法
6500万06 含偏微分方程初值和初边值问题的有限差分方法
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65亿75 涉及偏微分方程的初值和初边值问题的概率方法、粒子方法等
65平方米 涉及偏微分方程初值和初边值问题的特征线方法的数值方面
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法
76X05型 电磁场中的电离气体流动;浆流
76米28 粒子法和晶格气体法
60年第35季度 与光学和电磁理论相关的PDE
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tempus Trilinos套餐。https://github.com/trilinos/trilinos/tree/master/包/时间。
[2] OpenCL规范2.0版。技术报告,2015年7月。https://www.khronos.org/registry/OpenCL/specs/OpenCL-2.0.pdf。
[3] CUDA C++编程指南。技术报告,NVIDIA,2019年11月。https://docs。nvidia.com/pdf/CUDA_C_Programming_Guide.pdf。
[4] oneAPI编程模型。技术报告,英特尔公司,2019年11月。https://www.网址。onepi.com/。
[5] 2020年世界500强。[在线;访问时间:2020年6月30日]。
[6] M F Adams、S Ethier和N Wichmann。高并发计算体系结构上粒子单元方法的性能。《物理学杂志:会议系列》,第78卷,第012001页。IOP出版,2007年。
[7] T D Arber、K Bennett、C S Brady、A Lawrence-Douglas、M G Ramsay、N J Sircombe、P Gillies、R G Evans、H Schmitz、A R Bell和C P Ridgers。激光等离子体建模的当代粒子-细胞方法。等离子体物理与受控聚变,57(11):1130012015。
[8] 埃里克·巴维尔(Eric Bavier)、马克·霍曼(Mark Hoemmen)、西瓦桑卡兰·拉贾马尼卡姆(Sivasankaran Rajamanickam)和海蒂·桑奎斯特(Heidi Thornquist)。Amesos2和Belos:大型稀疏线性系统的直接和迭代解算器。科学计划,20(3):241-2552012年7月。
[9] 唐纳德·贝克尔(Donald J Becker)、托马斯·斯特林(Thomas Sterling)、丹尼尔·萨瓦雷斯(Daniel Savarese)、约翰·多尔班德(John E Dorband)、乌达亚·拉纳瓦克(Udaya A Ranawak)和查尔斯·五·帕克(Charles V Packer)。BEOWULF:科学计算的并行工作站。《国际并行处理会议记录》(ICPP'95),第11-14页,1995年。
[10] 吕克·伯格尔·韦尔吉亚特(Luc Berger-Vergiat)、克里斯蒂安·格卢萨(Christian A.Glusa)、乔纳森·胡锦涛(Jonathan J.Hu)、马提亚斯·迈尔(Matthias Mayr)、安德烈·普罗科彭科(Andrey Prokopenko)、克里斯托弗·西弗特(Christopher M。MueLu用户指南。技术报告SAND2019-0537,桑迪亚国家实验室,2019年。
[11] R F Bird、S J Pennycook、S A Wright和S A Jarvis。面向便携式和未来防护的颗粒-细胞等离子体物理代码。2013年5月,在第一届OpenCL国际研讨会(IWOCL 13)上。
[12] Robert F Bird、Patrick Gillies、Michael R Bareford、John Andy Herdman和Stephen A.Jarvis。使用小型应用程序对惯性约束聚变代码进行性能优化。《国际高性能计算应用杂志》,32(4):570-5812018。
[13] C.K.Birdsall和A.B.Langdon。计算机模拟等离子体物理。等离子体物理系列。英国布里斯托尔BS1 6BE物理出版研究所,1991年。
[14] Charles K Birdsall和Dieter Fuss。云中云,多体等离子体模拟的细胞内云物理。计算物理杂志,3(4):494-5111996·Zbl 0938.76088号
[15] 约瑟夫·布拉霍维奇(Joseph D Blahovec)、莱斯特·鲍尔斯(Lester A Bowers)、约翰·卢金斯兰(John W Luginsland)、杰拉尔德·萨瑟(Gerald E Sasser)和约翰·沃特鲁斯(John J Wa-trous)。相对论速调管振荡器的三维icepic模拟。IEEE等离子体科学学报,28(3):821-8292000。
[16] OpenMP体系结构审查委员会。OpenMP应用程序编程接口版本5.0。技术报告,2018年11月。https://www.openmp.org/wp-content/uploads/OpenMP-API-规范-5.0.pdf。
[17] P.Bochev、H.C.Edwards、R.C.Kirby、K.Peterson和D.Ridzal。使用In-trepid解决PDE。科学规划,20(2):151-1802012。
[18] P.Bochev和J.Hyman。微分算子的模拟离散化原理。可接受的空间离散化,第89-1192006页·Zbl 1110.65103号
[19] 巴维尔·博切夫、乔纳森·胡锦涛、克里斯托弗·西弗特和雷蒙德·斯图米纳罗。基于麦克斯韦方程的兼容规范重新计算的al-gebraic多重网格方法。SIAM科学计算杂志,31(1):557-5832008·Zbl 1184.78007号
[20] E.G.Boman、U.V.Catalysturek、C.Chevalier和K.D.Devine。组合科学计算的Zoltan和Isorropia并行工具包:分区、排序和着色。科学编程,20(2):129-1502012。
[21] 相对论等离子体模拟:混合代码的优化。《第四届等离子体数值模拟会议论文集》,第3-68页,海军研究实验室,华盛顿特区,1971年7月。
[22] A.博萨维特。三维场计算中“边缘元素”的基本原理。IEEE磁学汇刊,24(1):74-792988。
[23] K·J·鲍尔斯、B·J·奥尔布赖特、B·卑尔根、L·尹、K·J·巴克和D·J·科尔比森。0.374 pflop/s激光与等离子体相互作用的trillion粒子动力学模拟。在2008年美国计算机协会/电子工程师协会超级计算会议记录中,SC'08,第63:1-63:11页,美国新泽西州皮斯卡塔韦,2008年。IEEE出版社。
[24] K.J.Bowers、B.J.Albright、L.Yin、B.Bergen和T.J.T.Kwan。超高性能三维电磁相对论动力学等离子体模拟。等离子体物理学,15(5):0557032008。
[25] 弗朗科·布雷齐(Franco Brezzi)和米歇尔·福廷(Michel Fortin)。混合和混合有限元方法,第15卷。施普林格科学与商业媒体,2012年·Zbl 0788.7302号
[26] Dominic A.S.Brown、Matthew T.Bettencourt、Steven A.Wright、Satheesh Maheswaran、John P.Jones和Stephen A.Jarvis。用于粒子模拟的高阶粒子表示。计算物理杂志,435:1102552021年6月·Zbl 07503730号
[27] 多米尼克·A·S·布朗(Dominic A.S.Brown)、史蒂文·A·赖特(Steven A.Wright)和斯蒂芬·A·贾维斯(Stephen A.Jarvis)。第二种Or-der静电粒子单元算法在现代多核架构上的性能。《理论计算机科学电子笔记》,340:67-842018年10月。
[28] Heiko Burau、Reneée Widera、Wolfgang Honig、Guido Juckeland、Alexander Debus、Thomas Kluge、Ulrich Schramm、Tomas e Cowan、Roland Sauerbrey和Michael Bussmann。PICon-GPU:用于GPU集群的一种完全相对论的粒子间代码。IEEE等离子体科学汇刊,38(10):2831-28392010。
[29] 弗朗西斯·F·陈。等离子体物理和受控聚变导论。Springer,第三版,2016年。
[30] G.Chen、L.Chacón和D.C.Barnes。一种高效的混合精度、CPU-GPU混合im-plement的非线性隐式一维颗粒细胞算法。计算物理杂志,231(16):5374-53882012。
[31] OpenACC语言委员会等。OpenACC应用程序编程接口版本2.6。技术报告,2017年11月。https://www.openacc.org/sites/default/files网站/inline-files/OpenACC.2.6.final.pdf。
[32] 约翰·道森。一维等离子体模型。流体物理学,5(4):445-4591962·Zbl 0116.23001号
[33] 约翰·道森(John M.Dawson)。等离子体的粒子模拟。《现代物理学评论》,55:403-4471983年4月。
[34] 维克托·德西克(Viktor K.Decyk)和塔詹德拉·辛格(Tajendra V.Singh)。适用于图形处理单元的自适应颗粒间算法。计算机物理通信,182(3):641-6482011。
[35] 托马斯·杜普里。等离子体和电磁场的动力学理论。流体物理学(1958-1988),6(12):1714-17291963·Zbl 0127.22503号
[36] H.Carter Edwards、Christian R.Trott和Daniel Sunderland。Kokkos:通过多态内存访问模式实现多核性能可移植性。并行与分布式计算杂志,74(12):3202-32162014。用于高性能计算的领域特定语言和高级框架。
[37] R.A.Fonseca、L.O.Silva、F.S.Tsung、V.K.Decyk、W.Lu、C.Ren、W.B.Mori、S.Deng、S.Lee、T.Katsoulesa和J.C.Adam。OSIRIS:一种三维的、完全相对论性的粒子细胞代码,用于模拟等离子体加速器。Peter M.A.Sloot、Alfons G.Hoekstra、C.J.Kenneth Tan和Jack J.Dongarra,《2002年计算科学ICCS》编辑,第342-351页,柏林,海德堡,2002年。施普林格-柏林-海德堡·Zbl 1053.81100号
[38] 格雷戈里·弗里德曼(Gregory Fridman)、加里·弗雷德曼(Gary Fridmman)、亚历山大·古索尔(Alexander Gutsol)、安纳托利·谢克特(Anatoly B.Shekhter)、维克多·瓦西莱斯(Victor N.Vasilets)和。应用血浆医学。等离子体工艺与聚合物,5(6):503-5332008。
[39] 亚历克斯·弗里德曼。阻尼可调的二阶隐式粒子推进器。计算物理杂志,90(2):292-3121990年10月·Zbl 0701.76121号
[40] Kai Germaschowski、William Fox、Stephen Abbott、Narges Ahmadi、Kristofor Maynard、Liang Wang、Hartmut Ruhl和Amitava Bhattacharjee。等离子模拟代码:一种基于补丁的负载平衡的现代carticle-in-cell代码。计算物理杂志,318:305-3262016·Zbl 1349.76917号
[41] Philip M Gresho和Robert L Lee。不要抑制摇摆——他们在告诉你一些事情!计算机与流体,9(2):223-2531981年6月。
[42] Khronos OpenCL工作组等。SYCL规范版本1.2.1。技术报告,2019年11月。https://www.khronos.org/registry/SYCL/specs/SYCL-1.2.1.pdf。
[43] Michael A.Heroux、Rosco A.Bartlett、Vicki E.Howle、Robert J.Hoekstra、Jonathan J.Hu、Tamara G.Kolda、Richard B.Lehoucq、Kevin R.Long、Roger P.Pawlowski、Eric T.Phipps、Andrew G.Salinger、Heidi K.Thornquist、Ray S.Tuminaro、James M.Willenbring、Alan Williams和Kendall S.Stanley。Trilinos项目概述。ACM数学软件汇刊,31(3):397-4232005·Zbl 1136.65354号
[44] R.Hiptmair公司。计算电磁学中的有限元。《数字学报》,11:237-3392002年·Zbl 1123.78320号
[45] R.W.霍克尼。反常扩散的计算机实验。流体物理学,9(9):1826-18351966。
[46] 罗杰·霍克尼和詹姆斯·伊斯特伍德。使用粒子的计算机模拟。crc出版社,1988年·Zbl 0662.76002号
[47] Rich Hornung、Holger Jones、Jeff Keasler、Rob Neley、Olga Pearce、Si Hammond、Christian Trott、Paul Lin、Courtenay Vaughan、Jeanine Cook、Rob Hoekstra、Ben Bergen、Josh Payne和Geoff Womeldorff。2015年ASC三线合作设计二级里程碑报告。技术报告,劳伦斯·利弗莫尔国家实验室,2015年9月。
[48] 金建明。电磁学中的有限元方法。Wiley-IEEE出版社,第3版,2014年·Zbl 1001.78001号
[49] Y.L.Klimontovich。血浆中非平衡过程的统计理论:自然哲学专著国际丛书,第9卷。爱思唯尔,2013年。
[50] S.Ku、R.Hager、C.S.Chang、J.M.Kwon和S.E.Parker。托卡马克边缘等离子体回旋动力学模拟的一种新的混合拉格朗日数值格式。计算物理杂志,315:467-4752016·Zbl 1349.82148号
[51] A.B.兰登和C.K.伯索尔。使用有限化粒子的等离子体模拟理论。流体物理学,13(8):2115-2122,1970。
[52] 布鲁斯·兰登。关于在电磁粒子芯码中实施高斯定律。计算机物理通信,70(3):447-4501992。
[53] R.马尔坎德。Ptetra,一个模拟低轨道卫星-等离子体相互作用的工具。IEEE等离子体科学事务,40(2):217-2292012年2月。
[54] 巴里·马德尔。一种将高斯定律并入电磁pic码的方法。计算物理杂志,68(1):48-551987·Zbl 0603.65079号
[55] 科林·S·迈尔巴赫托尔、安德鲁·D·格林伍德、约翰·P·弗伦科和巴拉苏布拉曼尼亚·尚克尔。细胞中的共形电磁粒子:综述。IEEE等离子体科学汇刊,43(11):3778-37932015。
[56] 肖恩·T·米勒、埃里克·塞尔、约翰·N·沙迪德、理查德·迈克尔·杰克·克莱默、爱德华·杰弗里·菲利普斯、西达法·康德和罗杰·帕洛夫斯基。IMEX和多流体等离子体模型的精确序列离散化。计算物理杂志,397:1088062019·Zbl 1453.76081号
[57] Jean-Claude Nédélec。R3中的混合有限元。数字数学,35(3):315-3411980·Zbl 0419.65069号
[58] D.R.尼科尔森。等离子体理论导论。克里格出版公司,佛罗里达州马拉巴尔,1992年。
[59] S.J.Pennycook、J.D.Sewall和V.W.Lee。性能可移植性指标的含义。《未来一代计算机系统》,第947-958页,2017年。
[60] Martin Campos Pinto、Marie Mounier和Eric Sonnendrücker。处理maxwell和vlasov-maxwell模拟中的发散约束。《应用数学与计算》,272:403-419,2016年·Zbl 1410.82027号
[61] 蒂莫西·D·波顿。复杂几何中电磁粒子-细胞模拟的二阶精确电荷守恒。《计算机物理通讯》,179(8):535-5442008·Zbl 1197.82015年
[62] F.Rapetti和A.Bossavit。惠特尼形成了更高的学位。SIAM数值分析杂志,47(3):2369-23862009·Zbl 1195.78063号
[63] 马里奥·里克尔梅(Mario A.Riquelme)、艾略特·夸塔特(Eliot Quataert)和丹尼尔·弗沙伦(Daniel Verscharen)。高β天体物理和日光层等离子体中连续驱动镜和离子回旋加速器不稳定性的粒子模拟。《天体物理学杂志》,800(1):2015年2月27日。
[64] J.Roussel、F.Rogier、G.Dufour、J.Mateo-Velez、J.Forest、A.Hilgers、D.Rodgers、L.Girard和D.Payan。Spis开源代码:方法、功能、成就和前景。IEEE等离子体科学汇刊,36(5):2360-23682008年10月。
[65] Aaron Scheinberg、Guangye Chen、Stephane Ethier、Stuart Slattery、Robert F.Bird、Pat Wor-ley和Choong-Seock Chang。Kokkos和fortran在exascale计算项目等离子体物理代码xgc中。2019
[66] 斯图亚特·斯莱特里(Stuart Slattery)、克里斯托夫·琼汉斯(Christoph Junghans)、达米安·勒布伦·格兰迪(Damien Lebrun-Grandie)、谢恩·福格蒂(Shane Fogerty)、罗伯特·F·伯德(Robert F.Bird)、萨姆·里夫(Sam Reeve)、陈光业(Guangye Chen)、雷内·哈尔弗(Rene Halver)、亚。
[67] W.Tang、B.Wang、S.Ethier、G.Kwasniewski、T.Hoefler、K.Z.Ibrahim、K.Madduri、S.Williams、L.Oliker、C.Rosales-Fernandez和T.Williams。世界顶级超级计算机上的极端规模等离子体湍流模拟。SC'16:高性能计算、网络、存储和分析国际会议记录,第502-513页,2016年11月。
[68] J.-L.Vay、A.Almgren、J.Bell、L.Ge、D.P.Grote、M.Hogan、O.Kononenko、R.Lehe、A.My-ers、C.Ng、J.Park、R.Ryne、O.Shapoval、M.Thévenet和W.Zhang。Warp-x:一种新的非标度计算平台,用于束弹模拟。物理研究中的核仪器和方法A部分:加速器、光谱仪、探测器和相关设备,909:476-4792018。
[69] J.-L.Vay、P.Colella、J.W.Kwan、P.McCorquodale、D.B.Serafini、A.Friedman、D.P.Grote、G.Westenskow、J.-C.Adam、A.Héron和I.Haber。自适应网格细化在等离子体和束流粒子-细胞模拟中的应用。等离子体物理学,11(5):2928-29342004。
[70] 约翰·维拉塞诺和奥斯卡·邦曼。局部电磁场求解器的严格电荷守恒。计算机物理通信,69(2):306-3161992。
[71] B.Wang、S.Ethier、W.Tang、T.Williams、K.Z.Ibrahim、K.Madduri、S.William和L.Oliker。领导级系统上极端规模的动力学湍流模拟。SC'13:高性能计算、网络、存储和分析国际会议记录,第1-12页,2013年11月。
[72] E.Wang、S.Wu、Q.Zhang、J.Liu、W.Zhanng、Z.Lin、Y.Lu、Y.Du和X.Zhu。天河二号超级计算机上融合等离子体的回旋动力学粒子模拟。2016年11月,第7届大型系统可扩展算法最新进展研讨会(ScalA),第25-32页。
[73] 凯恩·谢伊(Kane S.Yee)。各向同性介质中麦克斯韦方程初边值问题的数值解。IEEE天线和传播学报,第302-307页,1966年·Zbl 1155.78304号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。