×

一种用于相对论空间电荷场计算的基于GPU并行插值的快速多极方法。 (英语) Zbl 07723496号

摘要:快速多极子方法(FMM)在束流物理模拟中受到越来越多的关注。在本研究中,我们提出了一种基于插值的FMM来计算相对论性空间电荷场。与准静电模型不同,我们的FMM是在实验室框架中制定的,并且可以在不借助洛伦兹变换的情况下应用。特别地,我们推导了一个改进的容许条件,该条件可以有效地控制所提出的FMM的插值误差。详细讨论了算法及其GPU并行化。包含串行和GPU并行解算器的包是用Julia编程语言实现的。与在单个CPU内核上执行相比,GPU并行化解算器可以达到超过100的加速。

MSC公司:

78至XX 光学、电磁理论
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 张,H。;波特曼,J。;陶,Z。;达克斯伯里,P。;阮,C.-Y。;Makino,K。;Berz,M.,Microsc公司。小肛门。,21、S4、224-229(2015)
[2] 张,H。;黄,H。;李,R。;陈,J。;Luo,L.-S.,AIP会议记录。,1812,1,第050001条pp.(2017)
[3] 兰斯顿,M。;Lethin,R。;Letourneau,P。;莫尔斯,M。;Wei,J.,(第十二届国际粒子加速器会议论文集,国际粒子加速器大会第12期(2021年),JACoW出版社:瑞士日内瓦JACoW出版社),4237-4240
[4] 戈登,M。;范德吉尔,S。;Maxson,J。;Kim,Y.-K.,物理。修订加速度。梁,24,8,第084202条pp.(2021)
[5] 施密德,S。;De Gersem,H。;多勒斯,M。;Gjonaj,E.,(第三届北美粒子加速器会议论文集。第三届北美洲粒子加速器会议文献集,WEPLE10(2019))
[6] Dawson,J.M.,修订版。物理。,55403-447(1983年)
[7] Birdsall,C.K。;Langdon,A.B.,《计算机模拟等离子体物理》(2018),CRC出版社
[8] Flöttmann,K。;Lidia,S。;Piot,P.,《ASTRA粒子跟踪代码的最新改进》(2003),劳伦斯伯克利国家实验室(LBNL):美国劳伦斯伯克莱国家实验室,技术代表。
[9] 强,J。;Lidia,S。;Ryne,R.D。;Limborg-Deprey,C.,物理。修订规范顶部。,加速度。Beams,9,第044204条,pp.(2006)
[10] Qiang,J.,《物理学》。修订加速度。梁,21,第054201条pp.(2018)
[11] 琼斯,F.W.,AIP Conf.Proc。,448, 1, 359-370 (1998)
[12] S.A.Schmid、H.D.Gersem、E.Gjonaj、REPTIL——基于快速多极方法的相对论三维空间电荷粒子跟踪代码,2019年,未出版。
[13] Qiang,J.,《物理学》。修订加速度。梁,20,第014203条pp.(2017)
[14] 施密德,S。;Gersem,H.D。;Gjonaj,E.,(第十二届国际粒子加速器会议记录,国际粒子加速器大会(2021年)第12号,JACoW出版社:瑞士日内瓦JACoW出版社),4244-4246
[15] 福比亚尼,G。;强,J。;Esarey,E。;Leemans,W.P。;杜根,G.,Phys。修订规范顶部。,加速度。Beams,9,第064402条,pp.(2006)
[16] Kan,Y.-K。;Kärtner,F.X。;勒博恩,S。;Zemke,J.-P.M.,计算。物理学。社区。,286,第108668条pp.(2023)·Zbl 1512.78039号
[17] Wilson,L。;沃恩,N。;Krasny,R.,计算机。物理学。社区。,265,第108017条pp.(2021)·Zbl 07695386号
[18] Wienke,S。;施普林格,P。;特博文,C。;an Mey,D.,(Kaklamanis,C.;Papatheodorou,T.;Spirakis,P.G.,《2012年欧洲-巴黎并行处理》(2012),斯普林格-柏林-海德堡:斯普林格柏林-海德堡-柏林,海德堡),859-870
[19] 方,W。;Darve,E.,J.计算。物理。,228, 23, 8712-8725 (2009) ·Zbl 1177.65009号
[20] 王,L。;Krasny,R。;特卢波娃,S.,Commun。计算。物理。,28, 4, 1415-1436 (2020) ·Zbl 1473.65025号
[21] Wilson,L.,《生物分子溶剂化中数值方法的发展与应用》(2021),密歇根大学博士论文
[22] Börm,S.,《非局部算子的有效数值方法:(H^2)-矩阵压缩、算法和分析》,EMS数学丛书,第14卷(2010年),欧洲数学学会(EMS):欧洲数学学会·Zbl 1208.65037号
[23] Hackbusch,W.,《层次矩阵:算法与分析》,第49卷(2015),施普林格出版社·Zbl 1336.65041号
[24] Appel,A.W.,SIAM J.科学。统计计算。,6, 1, 85-103 (1985)
[25] Dehnen,W.,J.计算。物理。,179,1,27-42(2002年)·Zbl 1130.85303号
[26] Bezanson,J。;Edelman,A。;卡宾斯基,S。;Shah,V.B.,SIAM版本,59,1,65-98(2017)·兹比尔1356.68030
[27] 横田,R。;Narumi,T。;Sakamaki,R。;Kameoka,S。;奥比,S。;Yasuoka,K.,计算。物理学。社区。,180, 11, 2066-2078 (2009)
[28] 拉舒克,I。;Chandramowlishwaran,A。;兰斯顿,H。;Nguyen,T.-A。;桑帕斯,R。;Shringarpure,A。;Vuduc,R。;Ying,L。;Zorin,D。;Biros,G.,(高性能计算网络、存储和分析会议记录(2009)),1-12
[29] 横田,R。;Bardhan,J.P。;Knepley,M.G。;Barba,L。;滨田,T.,计算。物理学。社区。,182, 6, 1272-1283 (2011) ·Zbl 1259.78044号
[30] 横田,R。;Barba,L。;Narumi,T。;Yasuoka,K.,计算。物理学。社区。,184, 3, 445-455 (2013)
[31] Wang,Y。;王,Q。;邓,X。;夏,Z。;严,J。;Xu,H.,高级工程师软件。,82, 105-118 (2015)
[32] 阿德尔曼,R。;Gumerov,N.A。;Duraiswami,R.,IEEE传输。马格纳。,53,12,1-11(2017)
[33] 高桥,T。;塞卡,C。;方,W。;Darve,E.,《国际数学家杂志》。方法工程,89,1,105-133(2012)·Zbl 1242.68364号
[34] 刘杰。;罗布森,M。;奎因,T。;Kulkarni,M.,(美国计算机学会超级计算国际会议论文集,ICS’19(2019),计算机械协会:美国纽约州纽约市计算机械协会),24-34
[35] Burtscher,M。;Pingali,K.,(Mei,W.;Hwu,W.,GPU Computing Gems Emerald Edition.GPU Competing Gems翡翠版,GPU计算系列的应用(2011),Morgan Kaufmann:Morgan Koufmann Boston),75-92
[36] Leighton Wilson,2022年,私人通信。
[37] Wilson,L。;沃恩,N.,BaryTree(2021)
[38] Cheng,J。;格罗斯曼,M。;McKercher,T.,专业CUDA C编程(2014),John Wiley&Sons
[39] Ferris,A.,StaticArrays(2016)
[40] Julia Computing,CUDA.jl(2016)
[41] 贝萨德,T。;Foket,C。;萨特,B.D.,IEEE Trans。并行分配系统。,30, 4, 827-841 (2019)
[42] 科尔曼,T.H。;Leiserson,C.E。;里维斯特,R.L。;Stein,C.,《算法导论》(2022),麻省理工学院出版社·Zbl 1503.68002号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。