摘要
补充材料
可供下载
保罗·博德和耶利米亚·奥斯特里克。 2008.树粒子模型:用于无碰撞宇宙模拟的自适应、高效和并行代码。 《天体物理学杂志补编系列》145,1(2008),1。 谷歌学者 交叉引用 卡斯滕·伯斯特德(Carsten Burstede)、乔治·斯塔德勒(Georg Stadler)、劳拉·艾利西奇(Laura Alisic)、卢卡斯·威尔科克斯(Lucas C.Wilcox)、伊坦(Eh Tan)、迈克尔·格尼斯(Michael Gurnis)和奥马尔·加塔斯(O。 2013年,大规模自适应地幔对流模拟。 《国际地球物理杂志》192,3(2013),889-906。 谷歌学者 交叉引用 卡斯滕·布尔斯特德、卢卡斯·C·威尔科克斯和奥马尔·加塔斯。 2011.p4est:八叉树森林上并行自适应网格细化的可伸缩算法。 SIAM科学计算期刊33,3(2011),1103-1133。 谷歌学者 数字图书馆 Aparna Chandramowlishwaran、Kamesh Madduri和Richard Vuduc。 2010.多核性能的诊断、调整和重新设计:快速多极方法的案例研究。 2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。 IEEE计算机学会,1-12。 谷歌学者 数字图书馆 A.J.Christlieb、R.Krasny、I.D.Boyd、J.Emhoff和J.Verbonoceur。 2005.无网格等离子体模拟。 IEEE会议记录——IEEE国际等离子体科学会议(ICOPS’05)摘要。 IEEE,246--246。 谷歌学者 David Colton和Rainer Kress。 1998年,《逆声和电磁散射理论》,第2版。 德国柏林施普林格。 谷歌学者 G.H.Cottet和P.D.Koumoutsakos。 2000.涡流方法:理论与实践。 剑桥大学出版社,英国剑桥。 谷歌学者 交叉引用 安德烈亚斯·德纳(Andreas Dedner)、弗里德曼·凯姆(Friedemann Kemm)、迪特马尔·科纳(Dietmar Kröner)、C.-D.蒙兹(C.-D.Munz)、托马斯·施尼策(Thomas Schnitzer)和马蒂亚斯·韦森伯格(Matthias Wesen。 MHD方程的双曲散度清理。 计算物理杂志175,2(2002),645--673。 谷歌学者 数字图书馆 M.Doi和S.F.Edwards。 1988年,《聚合物动力学理论》。 第73卷。 牛津大学出版社,英国牛津。 谷歌学者 Ron O.Dror、J.P.Grossman、Kenneth M.Mackenzie、Brian Towles、Edmond Chow、John K.Salmon、Cliff Young、Joseph A.Bank、Brannon Batson、Martin M.Deneroff、Jeffrey S.Kuskin、Richard H.Larson、Mark A.Moraes和David E.Shaw。 2010年,在anton上利用162纳秒的端到端通信延迟。 2010年ACM/IEEE高性能计算、网络、存储和分析国际会议。 IEEE,1-12。 内政部: http://dx.doi.org/10.109/SC.2010.23 谷歌学者 数字图书馆 迈克尔·G·达菲。 1982.顶点有奇点的被积函数金字塔或立方体上的求积。 SIAM数值分析杂志19,6(1982),1260--1262。 谷歌学者 交叉引用 Frank Ethridge和Leslie Greengard。 2001.一种新的二维快速多极加速泊松解算器。 SIAM科学计算杂志23,3(2001),741-760。 谷歌学者 数字图书馆 G.I.Fann、R.J.Harrison、G.Beylkin、J.Jia、R.Hartman-Baker、W.A.Shelton和S.Sugiki。 2007年,MADNESS应用于化学和核物理中的密度泛函理论。 《物理学杂志:会议系列》,第78卷。 IOP出版,2018年1月。 谷歌学者 A.Grama、A.Gupta、G.Karypis和V.Kumar。 2003.《并行计算导论:算法的设计与分析》(第二版)。 Addison Wesley,美国马萨诸塞州雷丁市。 谷歌学者 马克斯·甘兹伯格(Max D.Gunzburger)。 1989.粘性不可压缩流动的有限元。 学术出版社。 谷歌学者 Max D.Gunzburger和Roy A.Nicolaides。 1993年。不可压缩计算流体动力学。 剑桥大学出版社,英国剑桥。 谷歌学者 滨田(T.Hamada)、奈良美(T.Narumi)、横田康夫(R.Yokota)、安山康夫(K.Yasuoka)、奈田康树(K.Nitadori)和太极拳(M.Taiji)。 2009年,42 TFlops在GPU上进行分层N体模拟,在天体物理和湍流中都有应用。 SC09会议记录(SCxy会议系列)。 ACM/IEEE,俄勒冈州波特兰。 谷歌学者 数字图书馆 Robert J.Harrison、George I.Fann、Takeshi Yanai、Zhengting Gan和Gregory Beylkin。 多分辨量子化学:基本理论和初步应用。 《化学物理杂志》121,23(2004),11587-11598。 谷歌学者 交叉引用 Qi Hu、Nail A.Gumerov和Ramani Duraiswami。 2011.分布式异构架构上的可扩展快速多极方法。 2011年高性能计算、网络、存储和分析国际会议论文集。 ACM,第36页。 谷歌学者 数字图书馆 托宾·艾萨克、卡斯滕·伯斯特德和奥马尔·加塔斯。 2012.2:1八叉树平衡的低成本并行算法。 IEEE第26届并行与分布式处理国际研讨会(IPDPS’12)会议记录。 IEEE,426--437。 谷歌学者 数字图书馆 Pritish Jetley、Lukasz Wesolowski、Filippo Gioachin、Laxmikant V.Kalé和Thomas R.Quinn。 2010.在GPU集群上缩放层次化N体模拟。 2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集。 IEEE计算机学会,1-11。 谷歌学者 数字图书馆 A.V.Kravtsov、A.A.Klypin和A.M.Khokhlov。 1997.自适应优化树:用于宇宙学模拟的新的高分辨率N体代码。 《天体物理学杂志补编系列111》(1997年),73-94。 谷歌学者 交叉引用 哈珀·兰斯顿(Harper Langston)、莱斯利·格林加德(Leslie Greengard)和丹尼斯·佐林(Denis Zorin),2011年。 基于自由空间自适应FMM的三维PDE解算器。 应用数学与计算科学传播6,1(2011),79-122。 谷歌学者 交叉引用 伊利亚·拉舒克(Ilya Lashuk)、阿帕娜·昌德拉莫利什瓦兰(Aparna Chandramowlishwaran)、哈珀·兰斯顿(Harper Langston)、阮安恩(Tuan-Anh Nguyen)、拉胡尔·桑帕斯(Rahul Sampath)、阿沙伊·施林加普(Aashay Shringarpure)、理查德·武杜克(Richard。 2012.异构架构上的大规模并行自适应快速多极方法。 ACM通讯55,5(2012年5月),101-109。 谷歌学者 数字图书馆 基思·林赛和罗伯特·克拉斯尼。 2001.三维流动中涡旋片运动的粒子方法和自适应树代码。 计算物理杂志172,2(2001),879-907。 谷歌学者 数字图书馆 詹姆斯·W·洛特斯和保罗·F·费舍尔。 2005.用于谱元方法的混合多重网格/Swartz算法。 《科学计算杂志》24,1(2005),45-78。 谷歌学者 数字图书馆 Dhairya Malhotra和George Biros。 2015.PVFMM:用于粒子和体积势的并行核独立FMM。 计算物理通信18,3(2015),808--830。 谷歌学者 交叉引用 彼得·麦考代尔(Peter McCorquodale)、菲利普·科尔拉(Phillip Colella)、格雷戈里·鲍尔斯(Gregory T.Balls)和斯科特·巴登(Scott B.Baden)。 2006.三维泊松方程的局部修正算法。 应用数学与计算科学传播2,LBNL--62377(2006)。 谷歌学者 马蒂亚斯·梅斯纳(Matthias Messner)、贝伦格·布拉马斯(Bérenger Bramas)、奥利维尔·库劳(Olivier Coulaud)和埃里克·达夫(Eric Darve)。 2012.基于切比雪夫插值的快速多极方法的优化M2L内核。 arXiv预印arXiv:1210.7292(2012)。 谷歌学者 努卡达(Akira Nukada)、佐藤(Kento Sato)和松冈佐治(Satoshi Matsuoka)。 2012.TSUBAME 2.0超级计算机的可扩展多GPU三维FFT。 《高性能计算、网络、存储和分析国际会议论文集》(SC'12)。 IEEE,1-10。 谷歌学者 数字图书馆 詹姆斯·菲利普斯(James C.Phillips)、郑耿彬(Gengbin Zheng)、萨米尔·库马尔(Sameer Kumar)和拉克西坎特·卡莱(Laxmikant V.Kalé)。 2002.NAMD:在数千个处理器上进行生物分子模拟。 超级计算会议录(SCxy系列会议)。 马里兰州巴尔的摩ACM/IEEE。 谷歌学者 数字图书馆 乔尔·菲利普斯和雅各布·怀特。 1997年,一种用于复杂三维结构电阻分析的预校正-FFT方法。 IEEE集成电路和系统计算机辅助设计汇刊16,10(1997),1059--1072。 谷歌学者 数字图书馆 科斯塔斯·波兹里基迪斯。 2001.斯托克斯流的界面动力学。 计算物理杂志169(2001),250-301。 谷歌学者 数字图书馆 I.F.Sbalzarini、J.H.Walther、M.Bergdorf、S.E.Hieber、E.M.Kotsalis和P.Koumoutsakos。 2006.PPM——一个高效的并行粒子网格库,用于模拟连续统。 计算物理杂志215,2(2006),566--588。 谷歌学者 数字图书馆 V.Springel、N.Yoshida和S.D.M.White。 GADGET:无碰撞和气体动力学宇宙学模拟代码。 《新天文学》6,2(2001),79-117。 谷歌学者 交叉引用 哈里·桑达尔(Hari Sundar)、乔治·比罗斯(George Biros)、卡斯滕·伯斯特德(Carsten Burstede)、约翰·鲁迪(Johann Rudi)、奥马尔·加塔斯(Omar Ghattas)和乔治·斯塔德勒(Georg Stadler)。 2012.八叉树非结构化森林上的并行几何代数多重网格。 高性能计算、网络、存储和分析国际会议论文集。 IEEE计算机学会出版社,43。 谷歌学者 数字图书馆 Hari Sundar、Dhairya Malhotra和George Biros。 2013.HykSort:分布式内存体系结构上超立方体快速排序的新变体。 在ICS’13:超级计算国际会议论文集,2013。 谷歌学者 数字图书馆 Hari Sundar、Rahul S.Sampath和George Biros。 2008年。线性八叉树的自底向上构造和2:1平衡优化并行进行。 SIAM科学计算杂志30,5(2008),2675-2708。 内政部: http://dx.doi.org/10.1137/070681727 谷歌学者 数字图书馆 Toru Takahashi、Cris Cecka、William Fong和Eric Darve。 2012.在图形处理单元的快速多极方法中优化多极对本地操作器。 国际工程数值方法杂志89,1(2012),105--133。 谷歌学者 交叉引用 迈克尔·沃伦(Michael S.Warren)和约翰·萨尔蒙(John K.Salmon)。 1993年。并行散列八叉树n体算法。 1993年ACM/IEEE超级计算会议记录。 美国医学会,12--21。 谷歌学者 数字图书馆 Lexing Ying、George Biros和Denis Zorin,2004年。 二维和三维核相关自适应快速多极子方法。 《计算物理杂志》196,2(2004),591-626。 谷歌学者 数字图书馆 Lexing Ying、George Biros和Denis Zorin,2006年。 光滑区域椭圆偏微分方程的高阶三维边界积分方程求解器。 计算物理杂志219,1(2006),247--275。 谷歌学者 数字图书馆 Rio Yokota和Lorena A.Barba。 2012.作为exascale系统的卓越算法,一种可调整且可扩展的快速多极方法。 《国际高性能计算应用杂志》26,4(2012),337-346。 谷歌学者 数字图书馆 R.Yokota、J.P.Bardhan、M.G.Knepley、L.A.Barba和T.Hamada。 2011年,使用快速多极边界元法在512 GPUS和10亿未知量上进行生物分子静电。 计算机物理通信(2011)。 谷歌学者
建议
用于声散射预测的分布式内存GPGPU系统上FMM的并行化 在这项工作中,我们实现了单个级别的并行化 快速多极方法 (FMM)用于解决分布式内存GPGPU系统上的声散射问题(使用亥姆霍兹方程)。 为了扩大可行范围。。。 CPU+GPU异构结构下FMM的优化 CEC’12:2012 IEEE第14届商业和企业计算国际会议记录 CPU+GPU的异构体系结构是近年来高性能计算/并行处理的主要趋势。 然而,制定科学的算法以利用新架构提供的性能。。。 一种可调谐和可扩展的快速多极方法作为超尺度系统的一种卓越算法 在可能在未来的exascale计算中发挥主要作用的算法中,快速多极方法(fmm)是一颗冉冉升起的新星。 我们最近的工作显示了在gpu集群上扩展fmm,问题大小为。。。