跳到主要内容

967算法:一种用于体积势的分布式存储器快速多极方法

出版:2016年8月16日出版历史
跳过抽象节

摘要

常有效椭圆偏微分方程(PDE)的解可以使用积分变换计算:与PDE基本解的卷积,也称为体积势。我们提出了一种计算体积势的快速多极子方法(FMM),并用它来构造泊松、斯托克斯和低频亥姆霍兹问题的空间自适应解算器。传统的N体方法适用于离散粒子相互作用。用体积势,我们用体积积分代替和。粒子N体方法可用于加速此类积分。但开发一种特殊的FMM更有效。在本文中,我们讨论了这种FMM的有效实现。我们使用高阶分段切比雪夫多项式和八叉树数据结构来表示输入和输出场,并使近场和远场近似的核无关FMM(KIFMM)具有光谱精确近似。对于分布式内存并行性,我们使用了空间填充曲线、局部本质树和我们小组先前开发的类超立方体通信方案。我们提出了新的近距离和远距离交互遍历,以优化缓存使用。此外,与粒子N体代码不同,我们需要一个2:1的平衡树来允许预计算。我们提出了一种2:1平衡的快速方案。最后,我们使用矢量化,包括Intel Sandy Bridge体系结构上的AVX指令集,以获得超过50%的峰值浮点性能。我们使用任务并行性在德克萨斯州高级计算中心(TACC)的Stampede平台上使用Xeon Phi。我们实现了约600gflop公司/在单个节点上具有双精度性能。我们在Stampede上的最大一次跑步,在16公里核心上用了3.5秒,成绩是18分e(电子)+高度不均匀粒子分布的9个未知数(对应于超过3的有效分辨率e(电子)+23个未知数,因为我们在八叉树中使用了23个级别)。

跳过补充材料部分

补充材料

工具书类

  1. 保罗·博德和耶利米亚·奥斯特里克。2008.树粒子模型:用于无碰撞宇宙模拟的自适应、高效和并行代码。《天体物理学杂志补编系列》145,1(2008),1。谷歌学者谷歌学者交叉引用交叉引用
  2. 卡斯滕·伯斯特德(Carsten Burstede)、乔治·斯塔德勒(Georg Stadler)、劳拉·艾利西奇(Laura Alisic)、卢卡斯·威尔科克斯(Lucas C.Wilcox)、伊坦(Eh Tan)、迈克尔·格尼斯(Michael Gurnis)和奥马尔·加塔斯(O。2013年,大规模自适应地幔对流模拟。《国际地球物理杂志》192,3(2013),889-906。谷歌学者谷歌学者交叉引用交叉引用
  3. 卡斯滕·布尔斯特德、卢卡斯·C·威尔科克斯和奥马尔·加塔斯。2011.p4est:八叉树森林上并行自适应网格细化的可伸缩算法。SIAM科学计算期刊33,3(2011),1103-1133。谷歌学者谷歌学者数字图书馆数字图书馆
  4. Aparna Chandramowlishwaran、Kamesh Madduri和Richard Vuduc。2010.多核性能的诊断、调整和重新设计:快速多极方法的案例研究。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。IEEE计算机学会,1-12。谷歌学者谷歌学者数字图书馆数字图书馆
  5. A.J.Christlieb、R.Krasny、I.D.Boyd、J.Emhoff和J.Verbonoceur。2005.无网格等离子体模拟。IEEE会议记录——IEEE国际等离子体科学会议(ICOPS’05)摘要。IEEE,246--246。谷歌学者谷歌学者
  6. David Colton和Rainer Kress。1998年,《逆声和电磁散射理论》,第2版。德国柏林施普林格。谷歌学者谷歌学者
  7. G.H.Cottet和P.D.Koumoutsakos。2000.涡流方法:理论与实践。剑桥大学出版社,英国剑桥。谷歌学者谷歌学者交叉引用交叉引用
  8. 安德烈亚斯·德纳(Andreas Dedner)、弗里德曼·凯姆(Friedemann Kemm)、迪特马尔·科纳(Dietmar Kröner)、C.-D.蒙兹(C.-D.Munz)、托马斯·施尼策(Thomas Schnitzer)和马蒂亚斯·韦森伯格(Matthias Wesen。MHD方程的双曲散度清理。计算物理杂志175,2(2002),645--673。谷歌学者谷歌学者数字图书馆数字图书馆
  9. M.Doi和S.F.Edwards。1988年,《聚合物动力学理论》。第73卷。牛津大学出版社,英国牛津。谷歌学者谷歌学者
  10. Ron O.Dror、J.P.Grossman、Kenneth M.Mackenzie、Brian Towles、Edmond Chow、John K.Salmon、Cliff Young、Joseph A.Bank、Brannon Batson、Martin M.Deneroff、Jeffrey S.Kuskin、Richard H.Larson、Mark A.Moraes和David E.Shaw。2010年,在anton上利用162纳秒的端到端通信延迟。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议。IEEE,1-12。内政部:http://dx.doi.org/10.109/SC.2010.23谷歌学者谷歌学者数字图书馆数字图书馆
  11. 迈克尔·G·达菲。1982.顶点有奇点的被积函数金字塔或立方体上的求积。SIAM数值分析杂志19,6(1982),1260--1262。谷歌学者谷歌学者交叉引用交叉引用
  12. Frank Ethridge和Leslie Greengard。2001.一种新的二维快速多极加速泊松解算器。SIAM科学计算杂志23,3(2001),741-760。谷歌学者谷歌学者数字图书馆数字图书馆
  13. G.I.Fann、R.J.Harrison、G.Beylkin、J.Jia、R.Hartman-Baker、W.A.Shelton和S.Sugiki。2007年,MADNESS应用于化学和核物理中的密度泛函理论。《物理学杂志:会议系列》,第78卷。IOP出版,2018年1月。谷歌学者谷歌学者
  14. A.Grama、A.Gupta、G.Karypis和V.Kumar。2003.《并行计算导论:算法的设计与分析》(第二版)。Addison Wesley,美国马萨诸塞州雷丁市。谷歌学者谷歌学者
  15. 马克斯·甘兹伯格(Max D.Gunzburger)。1989.粘性不可压缩流动的有限元。学术出版社。谷歌学者谷歌学者
  16. Max D.Gunzburger和Roy A.Nicolaides。1993年。不可压缩计算流体动力学。剑桥大学出版社,英国剑桥。谷歌学者谷歌学者
  17. 滨田(T.Hamada)、奈良美(T.Narumi)、横田康夫(R.Yokota)、安山康夫(K.Yasuoka)、奈田康树(K.Nitadori)和太极拳(M.Taiji)。2009年,42 TFlops在GPU上进行分层N体模拟,在天体物理和湍流中都有应用。SC09会议记录(SCxy会议系列)。ACM/IEEE,俄勒冈州波特兰。谷歌学者谷歌学者数字图书馆数字图书馆
  18. Robert J.Harrison、George I.Fann、Takeshi Yanai、Zhengting Gan和Gregory Beylkin。多分辨量子化学:基本理论和初步应用。《化学物理杂志》121,23(2004),11587-11598。谷歌学者谷歌学者交叉引用交叉引用
  19. Qi Hu、Nail A.Gumerov和Ramani Duraiswami。2011.分布式异构架构上的可扩展快速多极方法。2011年高性能计算、网络、存储和分析国际会议论文集。ACM,第36页。谷歌学者谷歌学者数字图书馆数字图书馆
  20. 托宾·艾萨克、卡斯滕·伯斯特德和奥马尔·加塔斯。2012.2:1八叉树平衡的低成本并行算法。IEEE第26届并行与分布式处理国际研讨会(IPDPS’12)会议记录。IEEE,426--437。谷歌学者谷歌学者数字图书馆数字图书馆
  21. Pritish Jetley、Lukasz Wesolowski、Filippo Gioachin、Laxmikant V.Kalé和Thomas R.Quinn。2010.在GPU集群上缩放层次化N体模拟。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。IEEE计算机学会,1-11。谷歌学者谷歌学者数字图书馆数字图书馆
  22. A.V.Kravtsov、A.A.Klypin和A.M.Khokhlov。1997.自适应优化树:用于宇宙学模拟的新的高分辨率N体代码。《天体物理学杂志补编系列111》(1997年),73-94。谷歌学者谷歌学者交叉引用交叉引用
  23. 哈珀·兰斯顿(Harper Langston)、莱斯利·格林加德(Leslie Greengard)和丹尼斯·佐林(Denis Zorin),2011年。基于自由空间自适应FMM的三维PDE解算器。应用数学与计算科学传播6,1(2011),79-122。谷歌学者谷歌学者交叉引用交叉引用
  24. 伊利亚·拉舒克(Ilya Lashuk)、阿帕娜·昌德拉莫利什瓦兰(Aparna Chandramowlishwaran)、哈珀·兰斯顿(Harper Langston)、阮安恩(Tuan-Anh Nguyen)、拉胡尔·桑帕斯(Rahul Sampath)、阿沙伊·施林加普(Aashay Shringarpure)、理查德·武杜克(Richard。2012.异构架构上的大规模并行自适应快速多极方法。ACM通讯55,5(2012年5月),101-109。谷歌学者谷歌学者数字图书馆数字图书馆
  25. 基思·林赛和罗伯特·克拉斯尼。2001.三维流动中涡旋片运动的粒子方法和自适应树代码。计算物理杂志172,2(2001),879-907。谷歌学者谷歌学者数字图书馆数字图书馆
  26. 詹姆斯·W·洛特斯和保罗·F·费舍尔。2005.用于谱元方法的混合多重网格/Swartz算法。《科学计算杂志》24,1(2005),45-78。谷歌学者谷歌学者数字图书馆数字图书馆
  27. Dhairya Malhotra和George Biros。2015.PVFMM:用于粒子和体积势的并行核独立FMM。计算物理通信18,3(2015),808--830。谷歌学者谷歌学者交叉引用交叉引用
  28. 彼得·麦考代尔(Peter McCorquodale)、菲利普·科尔拉(Phillip Colella)、格雷戈里·鲍尔斯(Gregory T.Balls)和斯科特·巴登(Scott B.Baden)。2006.三维泊松方程的局部修正算法。应用数学与计算科学传播2,LBNL--62377(2006)。谷歌学者谷歌学者
  29. 马蒂亚斯·梅斯纳(Matthias Messner)、贝伦格·布拉马斯(Bérenger Bramas)、奥利维尔·库劳(Olivier Coulaud)和埃里克·达夫(Eric Darve)。2012.基于切比雪夫插值的快速多极方法的优化M2L内核。arXiv预印arXiv:1210.7292(2012)。谷歌学者谷歌学者
  30. 努卡达(Akira Nukada)、佐藤(Kento Sato)和松冈佐治(Satoshi Matsuoka)。2012.TSUBAME 2.0超级计算机的可扩展多GPU三维FFT。《高性能计算、网络、存储和分析国际会议论文集》(SC'12)。IEEE,1-10。谷歌学者谷歌学者数字图书馆数字图书馆
  31. 詹姆斯·菲利普斯(James C.Phillips)、郑耿彬(Gengbin Zheng)、萨米尔·库马尔(Sameer Kumar)和拉克西坎特·卡莱(Laxmikant V.Kalé)。2002.NAMD:在数千个处理器上进行生物分子模拟。超级计算会议录(SCxy系列会议)。马里兰州巴尔的摩ACM/IEEE。谷歌学者谷歌学者数字图书馆数字图书馆
  32. 乔尔·菲利普斯和雅各布·怀特。1997年,一种用于复杂三维结构电阻分析的预校正-FFT方法。IEEE集成电路和系统计算机辅助设计汇刊16,10(1997),1059--1072。谷歌学者谷歌学者数字图书馆数字图书馆
  33. 科斯塔斯·波兹里基迪斯。2001.斯托克斯流的界面动力学。计算物理杂志169(2001),250-301。谷歌学者谷歌学者数字图书馆数字图书馆
  34. I.F.Sbalzarini、J.H.Walther、M.Bergdorf、S.E.Hieber、E.M.Kotsalis和P.Koumoutsakos。2006.PPM——一个高效的并行粒子网格库,用于模拟连续统。计算物理杂志215,2(2006),566--588。谷歌学者谷歌学者数字图书馆数字图书馆
  35. V.Springel、N.Yoshida和S.D.M.White。GADGET:无碰撞和气体动力学宇宙学模拟代码。《新天文学》6,2(2001),79-117。谷歌学者谷歌学者交叉引用交叉引用
  36. 哈里·桑达尔(Hari Sundar)、乔治·比罗斯(George Biros)、卡斯滕·伯斯特德(Carsten Burstede)、约翰·鲁迪(Johann Rudi)、奥马尔·加塔斯(Omar Ghattas)和乔治·斯塔德勒(Georg Stadler)。2012.八叉树非结构化森林上的并行几何代数多重网格。高性能计算、网络、存储和分析国际会议论文集。IEEE计算机学会出版社,43。谷歌学者谷歌学者数字图书馆数字图书馆
  37. Hari Sundar、Dhairya Malhotra和George Biros。2013.HykSort:分布式内存体系结构上超立方体快速排序的新变体。在ICS’13:超级计算国际会议论文集,2013。谷歌学者谷歌学者数字图书馆数字图书馆
  38. Hari Sundar、Rahul S.Sampath和George Biros。2008年。线性八叉树的自底向上构造和2:1平衡优化并行进行。SIAM科学计算杂志30,5(2008),2675-2708。内政部:http://dx.doi.org/10.1137/070681727谷歌学者谷歌学者数字图书馆数字图书馆
  39. Toru Takahashi、Cris Cecka、William Fong和Eric Darve。2012.在图形处理单元的快速多极方法中优化多极对本地操作器。国际工程数值方法杂志89,1(2012),105--133。谷歌学者谷歌学者交叉引用交叉引用
  40. 迈克尔·沃伦(Michael S.Warren)和约翰·萨尔蒙(John K.Salmon)。1993年。并行散列八叉树n体算法。1993年ACM/IEEE超级计算会议记录。美国医学会,12--21。谷歌学者谷歌学者数字图书馆数字图书馆
  41. Lexing Ying、George Biros和Denis Zorin,2004年。二维和三维核相关自适应快速多极子方法。《计算物理杂志》196,2(2004),591-626。谷歌学者谷歌学者数字图书馆数字图书馆
  42. Lexing Ying、George Biros和Denis Zorin,2006年。光滑区域椭圆偏微分方程的高阶三维边界积分方程求解器。计算物理杂志219,1(2006),247--275。谷歌学者谷歌学者数字图书馆数字图书馆
  43. Rio Yokota和Lorena A.Barba。2012.作为exascale系统的卓越算法,一种可调整且可扩展的快速多极方法。《国际高性能计算应用杂志》26,4(2012),337-346。谷歌学者谷歌学者数字图书馆数字图书馆
  44. R.Yokota、J.P.Bardhan、M.G.Knepley、L.A.Barba和T.Hamada。2011年,使用快速多极边界元法在512 GPUS和10亿未知量上进行生物分子静电。计算机物理通信(2011)。谷歌学者谷歌学者

索引术语

  1. 967算法:一种用于体电位的分布式存储器快速多极方法

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      数学软件上的封面图像ACM事务
      ACM数学软件汇刊 第43卷第2期
      2017年6月
      200页
      国际标准编号:0098-3500
      EISSN公司:1557-7295
      内政部:10.1145/2988256
      期刊目录

      版权所有©2016 ACM

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2016年8月16日
      • 修订过的:2016年2月1日
      • 认可的:2016年2月1日
      • 收到:2014年8月1日
      发布于汤姆斯第43卷第2期

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文
      • 研究
      • 推荐

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器