跳到主要内容
研究文章

算法967:一种分布式存储器快速多极体电位方法

出版:2016年8月16日 出版历史

摘要

常有效椭圆偏微分方程(PDE)的解可以使用积分变换计算:与PDE基本解的卷积,也称为体积势。我们提出了一种计算体积势的快速多极子方法(FMM),并用它来构造泊松、斯托克斯和低频亥姆霍兹问题的空间自适应解算器。传统的N体方法适用于离散粒子相互作用。用体积势,我们用体积积分代替和。粒子N体方法可用于加速此类积分。但开发一种特殊的FMM更有效。在本文中,我们讨论了这种FMM的有效实现。我们使用高阶分段切比雪夫多项式和八叉树数据结构来表示输入和输出场,并使近场和远场近似的核无关FMM(KIFMM)具有光谱精确近似。对于分布式内存并行性,我们使用了空间填充曲线、局部本质树和我们小组先前开发的类超立方体通信方案。我们提出了新的近距离和远距离交互遍历,以优化缓存使用。此外,与粒子N体代码不同,我们需要一个2:1的平衡树来允许预计算。我们提出了一种2:1平衡的快速方案。最后,我们使用矢量化,包括Intel Sandy Bridge体系结构上的AVX指令集,以获得超过50%的峰值浮点性能。我们使用任务并行性在德克萨斯州高级计算中心(TACC)的Stampede平台上使用Xeon Phi。我们实现了约600gflop公司/在单个节点上具有双精度性能。我们在Stampede上的最大一次跑步,在16公里核心上用了3.5秒,成绩是18分e(电子)+高度不均匀粒子分布的9个未知数(对应于超过3的有效分辨率e(电子)+23个未知数,因为我们在八叉树中使用了23个级别)。

补充材料

ZIP文件 (967.拉链)
一种分布式存储器快速多极体电位法的软件

工具书类

[1]
保罗·博德和耶利米亚·奥斯特里克。2008.树粒子模型:用于无碰撞宇宙模拟的自适应、高效和并行代码。《天体物理学杂志补编系列》145,1(2008),1。
[2]
卡斯滕·伯斯特德(Carsten Burstede)、乔治·斯塔德勒(Georg Stadler)、劳拉·艾利西奇(Laura Alisic)、卢卡斯·威尔科克斯(Lucas C.Wilcox)、伊坦(Eh Tan)、迈克尔·格尼斯(Michael Gurnis)和奥马尔·加塔斯(O。2013年,大规模自适应地幔对流模拟。《国际地球物理杂志》192,3(2013),889-906。
[3]
Carsten Burstedde、Lucas C.Wilcox和Omar Ghattas。2011.p4est:八叉树森林上并行自适应网格细化的可伸缩算法。SIAM科学计算杂志33,3(2011),1103--1133。
[4]
阿帕娜·钱德拉莫利什瓦兰(Aparna Chandramowlishwaran)、卡梅什·马杜里(Kamesh Madduri)和理查德·武杜克(Richard Vuduc)。2010.多核性能的诊断、调整和重新设计:快速多极方法的案例研究。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。IEEE计算机协会,1-12。
[5]
A.J.Christlieb、R.Krasny、I.D.Boyd、J.Emhoff和J.Verbonoceur。2005.无网格等离子体模拟。IEEE会议记录——IEEE国际等离子体科学会议(ICOPS’05)摘要。IEEE,246--246。
[6]
David Colton和Rainer Kress。1998年,《逆声和电磁散射理论》,第2版。德国柏林施普林格。
[7]
G.H.Cottet和P.D.Koumoutsakos。2000.涡流方法:理论与实践。剑桥大学出版社,英国剑桥。
[8]
安德烈亚斯·德纳(Andreas Dedner)、弗里德曼·凯姆(Friedemann Kemm)、迪特马尔·科纳(Dietmar Kröner)、C.-D.蒙兹(C.-D.Munz)、托马斯·施尼策(Thomas Schnitzer)和马蒂亚斯·韦森伯格(Matthias Wesen。MHD方程的双曲散度清理。计算物理杂志175,2(2002),645--673。
[9]
M.Doi和S.F.Edwards。1988年,《聚合物动力学理论》。第73卷。牛津大学出版社,英国牛津。
[10]
Ron O.Dror、J.P.Grossman、Kenneth M.Mackenzie、Brian Towles、Edmond Chow、John K.Salmon、Cliff Young、Joseph A.Bank、Brannon Batson、Martin M.Deneroff、Jeffrey S.Kuskin、Richard H.Larson、Mark A.Moraes和David E.Shaw。2010年,在anton上利用162纳秒的端到端通信延迟。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议。IEEE,1-12。
[11]
迈克尔·G·达菲。1982.顶点有奇点的被积函数金字塔或立方体上的求积。SIAM数值分析杂志19,6(1982),1260--1262。
[12]
Frank Ethridge和Leslie Greengard。2001.一种新的二维快速多极加速泊松解算器。SIAM科学计算杂志23,3(2001),741-760。
[13]
G.I.Fann、R.J.Harrison、G.Beylkin、J.Jia、R.Hartman-Baker、W.A.Shelton和S.Sugiki。2007年,MADNESS应用于化学和核物理中的密度泛函理论。《物理学杂志:会议系列》,第78卷。IOP出版社,012018。
[14]
A.Grama、A.Gupta、G.Karypis和V.Kumar。2003年,《并行计算导论:算法设计与分析》(第二版)。Addison Wesley,美国马萨诸塞州雷丁。
[15]
马克斯·甘兹伯格(Max D.Gunzburger)。1989.粘性不可压缩流动的有限元。学术出版社。
[16]
Max D.Gunzburg和Roy A.Nicolaides。1993年。不可压缩计算流体动力学。剑桥大学出版社,英国剑桥。
[17]
滨田(T.Hamada)、奈良美(T.Narumi)、横田康夫(R.Yokota)、安山康夫(K.Yasuoka)、奈田康树(K.Nitadori)和太极拳(M.Taiji)。2009年,42 TFlops在GPU上进行分层N体模拟,在天体物理和湍流中都有应用。SC09会议记录(SCxy会议系列)。ACM/IEEE,俄勒冈州波特兰。
[18]
Robert J.Harrison、George I.Fann、Takeshi Yanai、Zhengting Gan和Gregory Beylkin。多分辨量子化学:基本理论和初步应用。《化学物理杂志》121,23(2004),11587-11598。
[19]
Qi Hu、Nail A.Gumerov和Ramani Duraiswami。2011.分布式异构架构上的可扩展快速多极方法。2011年高性能计算、网络、存储和分析国际会议论文集。ACM,第36页。
[20]
托宾·艾萨克、卡斯滕·伯斯特德和奥马尔·加塔斯。2012.2:1八叉树平衡的低成本并行算法。IEEE第26届并行与分布式处理国际研讨会(IPDPS’12)会议记录。IEEE,426--437。
[21]
Pritish Jetley、Lukasz Wesolowski、Filippo Gioachin、Laxmikant V.Kalé和Thomas R.Quinn。2010.在GPU集群上缩放层次化N体模拟。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。IEEE计算机学会,1-11。
[22]
A.V.Kravtsov、A.A.Klypin和A.M.Khokhlov。1997.自适应优化树:用于宇宙学模拟的新的高分辨率N体代码。《天体物理学杂志补编系列111》(1997年),73-94。
[23]
哈珀·兰斯顿(Harper Langston)、莱斯利·格林加德(Leslie Greengard)和丹尼斯·佐林(Denis Zorin),2011年。基于自由空间自适应FMM的三维PDE解算器。应用数学与计算科学传播6,1(2011),79-122。
[24]
伊利亚·拉舒克(Ilya Lashuk)、阿帕娜·昌德拉莫利什瓦兰(Aparna Chandramowlishwaran)、哈珀·兰斯顿(Harper Langston)、阮安恩(Tuan-Anh Nguyen)、拉胡尔·桑帕斯(Rahul Sampath)、阿沙伊·施林加普(Aashay Shringarpure)、理查德·武杜克(Richard。2012.异构架构上的大规模并行自适应快速多极方法。ACM通讯55,5(2012年5月),101-109。
[25]
基思·林赛和罗伯特·克拉斯尼。2001.三维流动中涡片运动的粒子方法和自适应树码。计算物理杂志172,2(2001),879-907。
[26]
詹姆斯·洛特斯(James W.Lottes)和保罗·菲舍尔(Paul F.Fischer)。2005.谱元法的混合多重网格/Schwarz算法。《科学计算杂志》24,1(2005),45-78。
[27]
Dhairya Malhotra和George Biros。2015。PVFMM:一种用于粒子和体积势的平行核独立FMM。计算物理通信18,3(2015),808--830。
[28]
彼得·麦考代尔(Peter McCorquodale)、菲利普·科尔拉(Phillip Colella)、格雷戈里·鲍尔斯(Gregory T.Balls)和斯科特·巴登(Scott B.Baden)。2006.三维泊松方程的局部修正算法。应用数学与计算科学传播2,LBNL--62377(2006)。
[29]
马蒂亚斯·梅斯纳(Matthias Messner)、贝伦格·布拉马斯(Bérenger Bramas)、奥利维尔·库劳(Olivier Coulaud)和埃里克·达夫(Eric Darve)。2012.基于切比雪夫插值的快速多极方法的优化M2L内核。arXiv预印arXiv:1210.7292(2012)。
[30]
努卡达(Akira Nukada)、佐藤(Kento Sato)和松冈佐治(Satoshi Matsuoka)。2012.TSUBAME 2.0超级计算机的可扩展多GPU三维FFT。《高性能计算、网络、存储和分析国际会议论文集》(SC'12)。IEEE,1-10。
[31]
詹姆斯·菲利普斯(James C.Phillips)、郑耿彬(Gengbin Zheng)、萨米尔·库马尔(Sameer Kumar)和拉克西坎特·卡莱(Laxmikant V.Kalé)。2002.NAMD:在数千个处理器上进行生物分子模拟。超级计算会议录(SCxy系列会议)。马里兰州巴尔的摩ACM/IEEE。
[32]
乔尔·菲利普斯和雅各布·怀特。1997年,一种用于复杂三维结构电阻分析的预校正-FFT方法。IEEE集成电路和系统计算机辅助设计汇刊16,10(1997),1059--1072。
[33]
科斯塔斯·波兹里基迪斯。2001年,斯托克斯流动的界面动力学。计算物理杂志169(2001),250-301。
[34]
I.F.Sbalzarini、J.H.Walther、M.Bergdorf、S.E.Hieber、E.M.Kotsalis和P.Koumoutsakos。2006.PPM——一个高效的并行粒子网格库,用于模拟连续统。计算物理杂志215,2(2006),566--588。
[35]
V.Springel、N.Yoshida和S.D.M.White。GADGET:无碰撞和气体动力学宇宙学模拟代码。《新天文学》6,2(2001),79-117。
[36]
哈里·桑达尔(Hari Sundar)、乔治·比罗斯(George Biros)、卡斯滕·伯斯特德(Carsten Burstede)、约翰·鲁迪(Johann Rudi)、奥马尔·加塔斯(Omar Ghattas)和乔治·斯塔德勒(Georg Stadler)。2012.八叉树非结构化森林上的并行几何代数多重网格。高性能计算、网络、存储和分析国际会议论文集。IEEE计算机学会出版社,43。
[37]
哈里·桑达尔(Hari Sundar)、达里亚·马霍特拉(Dhairya Malhotra)和乔治·比罗斯(George Biros)。2013.HykSort:分布式内存体系结构上超立方体快速排序的新变体。在ICS’13:2013年超级计算国际会议记录中。
[38]
哈里·桑达尔(Hari Sundar)、拉胡尔·桑帕斯(Rahul S.Sampath)和乔治·比罗斯(George Biros)。2008年。线性八叉树的自底向上构造和2:1平衡优化并行进行。SIAM科学计算杂志30,5(2008),2675-2708。
[39]
Toru Takahashi、Cris Cecka、William Fong和Eric Darve。2012.在图形处理单元的快速多极方法中优化多极对本地操作器。国际工程数值方法杂志89,1(2012),105--133。
[40]
迈克尔·沃伦(Michael S.Warren)和约翰·萨尔蒙(John K.Salmon)。1993年。并行散列八叉树n体算法。1993年ACM/IEEE超级计算会议记录。美国医学会,12--21。
[41]
Lexing Ying、George Biros和Denis Zorin,2004年。二维和三维核相关自适应快速多极子方法。《计算物理杂志》196,2(2004),591-626。
[42]
Lexing Ying、George Biros和Denis Zorin,2006年。光滑区域椭圆偏微分方程的高阶三维边界积分方程求解器。计算物理杂志219,1(2006),247--275。
[43]
Rio Yokota和Lorena A.Barba。2012.作为exascale系统的卓越算法,一种可调整且可扩展的快速多极方法。《国际高性能计算应用杂志》26,4(2012),337-346。
[44]
R.Yokota、J.P.Bardhan、M.G.Knepley、L.A.Barba和T.Hamada。2011年,使用快速多极边界元法在512 GPUS和10亿未知量上进行生物分子静电。计算机物理通信(2011)。

引用人

查看全部

索引术语

  1. 967算法:一种用于体电位的分布式存储器快速多极方法

    建议

    评论

    信息和贡献者

    问询处

    发布于

    数学软件上的封面图像ACM事务
    ACM数学软件汇刊 第43卷第2期
    2017年6月
    200页
    国际标准编号:0098-3500
    EISSN公司:1557-7295
    内政部:10.1145/2988256
    期刊目录
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表,需要事先获得特定许可和/或收取费用。从请求权限[电子邮件保护].

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2016年8月16日
    认可的:2016年2月1日
    修订过的:2016年2月1日
    收到:2014年8月1日
    在TOMS中发布体积43,问题2

    权限

    请求对此文章的权限。

    检查更新

    徽章

    作者标记

    1. FMM(飞行管理模块)
    2. N体问题
    3. 势理论

    限定符

    • 研究文章
    • 研究
    • 推荐

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)12
    • 下载次数(最近6周)0
    反映截至2024年9月20日的下载量

    其他指标

    引文

    引用人

    查看全部
    • (2024)细长体的高效收敛边界积分方法计算物理杂志2016年10月10日/j.jcp.2024.112855503:C在线发布日期:2024年4月15日
    • (2023)大规模并行插值因子格林函数法计算物理杂志2016年10月10日/j.jcp.2022.111837475(111837)在线发布日期:2023年2月
    • (2022)通过MMEwald在多核上缩放泊松解IEEE并行和分布式系统汇刊10.1109/TPDS.2021.3127138号33:8(1888-1901)在线发布日期:2022年8月1日
    • (2022)CASPHAr:异构系统架构中的缓存管理加速器暂存和流水线IEEE集成电路和系统计算机辅助设计汇刊10.1109/TCAD.2022.3197535号41:11(4325-4336)在线发布日期:2022年11月1日
    • (2022)基于三次插值的树编码算法计算数学与数据科学杂志2016年10月10日/j.jcmds.2022.100068(100068)在线发布日期:2022年11月
    • (2022)注塑模具三维瞬态有限元冷却模拟国际先进制造技术杂志10.1007/s00170-022-09154-8120:11-12(7919-7936)在线发布日期:2022年5月5日
    • (2021)高性能计算的硬件加速器集成权衡:N体方法中GEMM加速的案例研究IEEE并行和分布式系统汇刊10.1109/TPDS.2021.305604532:8(2035-2048)在线发布日期:2021年8月1日
    • (2021)基于重心拉格朗日插值和双树遍历的GPU加速快速多极子方法计算机物理通信2016年10月10日/j.cpc.2021.08017265(108017)在线发布日期:2021年8月
    • (2020)2:1八叉树平衡的最小同步算法评估高性能计算、网络、存储和分析国际会议记录10.5555/3433701.3433731(1-12)在线发布日期:2020年11月9日
    • (2020)求解超大、广域电力线模型的高度并行边界元方法国际高性能计算应用杂志10.1177/1094342020976783(109434202097678)在线发布日期:2020年12月3日
    • 显示更多引用者

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享