×

三维分布式自适应快速多极子方法。 (英语) Zbl 1473.65004号

摘要:我们开发了一种通用的分布式实现的三维自适应快速多极子方法。我们依赖于一种平衡类型的自适应空间离散化,它支持高度透明和完全分布式的实现。复杂度分析表明,具有良好的缩放特性,在多达512个核和10亿个源点上进行的数值实验验证了这一点。控制算法的参数需要进行深入的实验,对输入参数的性能响应表明,总体实现非常适合自动调整。

MSC公司:

65B10型 级数的数值求和
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法
65年20月 数值算法的复杂性和性能
68宽15 分布式算法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] T.Askham和A.Cerfon。复杂几何体的自适应快速多极加速泊松解算器。《计算物理杂志》,344:1-222017年。http://dx.doi.org/10.1016/j.jcp.2017.04.063年4月·Zbl 1380.65413号 ·doi:10.1016/j.jcp.2017.04.063
[2] L.Barba和R.Yokota。快速多极方法在exascale时代会如何发展?SIAM新闻,46(6),2013年。
[3] R.Beatson和L.Greengard。《快速多极方法短训》,第1-37页。牛津大学出版社,1997年·Zbl 0882.65106号
[4] H.Cheng、L.Greengard和V.Rokhlin。一种三维快速自适应多极子算法。J.计算。物理。,155(2):468-498, 1999. http://dx.doi.org/10.1006/jcph.1999。 6355 ·Zbl 0937.65126号 ·doi:10.1006/jcph.1999.6355
[5] B.A.西普拉。20世纪最好的算法:编辑列出了前十大算法。SIAM新闻,33(4),2000年。
[6] P.Coulier、H.Pouransari和E.Darve。逆快速多极方法:使用快速近似直接求解器作为稠密线性系统的预处理器。SIAM科学计算杂志,39(3):A761-A7962017。http://dx.doi.org/10.1137/15M1034477 ·Zbl 1365.65068号 ·doi:10.1137/15M1034477
[7] F.Cruz、M.G.Knepley和L.Barba。PetFMM—动态负载平衡并行快速多极库。国际期刊数字。方法工程师,85:403-4282011。http://dx.doi.org/10。1002/2972海里·Zbl 1217.70005号 ·doi:10.1002/nme.2972
[8] S.Engblom公司。关于分离良好的集合和快速多极方法。应用数值数学,61:1096-11022011。http://dx.doi.org/10.1016/j.apnum.2011.06.011 ·Zbl 1226.65098号 ·doi:10.1016/j.apnum.2011.06.011
[9] A.Ghoma、D.Malhotra、H.Sundar和G.Biros。FFT、FMM还是多重网格?单位立方体中最新泊松解算器的比较研究https://arxiv.org/abs/ 1408.6497, 2014.
[10] A.Goude和S.Engblom。GPU上的自适应快速多极方法。《超级计算杂志》,63:897-9182013年。http://dx.doi.org/10.1007/s11227-012-0836-0 ·doi:10.1007/s11227-012-0836-0
[11] L.Greengard和V.Rokhlin。粒子模拟的快速算法。《计算物理杂志》,73:325-3481987年。http://dx.doi.org/10.1016/0021-9991(87)90140-9 ·Zbl 0629.65005号
[12] N.A.Gumerov和R.Duraiswami。图形处理器上的快速多极方法。J.Com-输入。物理。,227(18):8290-8313, 2008. http://dx.doi.org/10.1016/j.jcp.2008.05.023 ·兹比尔1147.65012 ·doi:10.1016/j.jp.2008.05.023
[13] M.Holm、S.Engblom、A.Goude和S.Holmgren。混合多核CPU和GPU系统上自适应快速多极方法的动态自动调谐。SIAM科学计算杂志,36(4):376-3992014。http://dx.doi.org/10.1137/10943595 ·Zbl 1305.65008号 ·数字对象标识代码:10.1137/130943595
[14] H.Ibeid、R.Yokota、J.Pestana和D.Keyes。椭圆方程稀疏矩阵的快速多极预条件。科学计算与可视化,18(6):213-2292018。http://dx.doi.org/10.1007/s0079 ·Zbl 1398.65039号 ·doi:10.1007/s0079
[15] Z.Jinshi、L.Yongmei和J.S.基于空间分解的并行FMM算法。第九届网格和云计算国际会议,第168-173页。IEEE,2010年。http://dx.doi.org/10.109/GCC.2010.43 ·doi:10.1109/GCC.2010.43
[16] I.Lashuk、A.Chandramowlishwaran、H.Langston、T.-A.Nguyen、R.Sampath、A.Shringarpure、R.Vuduc、L.Ying、D.Zorin和G.Biros。异构体系结构上的大规模并行自适应快速多极方法。Commun公司。ACM,55:101-109,2012年。http://dx.doi.org/10.1145/1654059.1654118 ·数字对象标识代码:10.1145/1654059.1654118
[17] D.Malhotra和G.Biros。PVFMM:一种用于粒子和体积势的并行核独立FMM。Commun公司。计算。物理。,18(3):808-830, 2015. http://dx.doi.org/10。4208/cicp.020215.150515sw·Zbl 1388.65169号 ·doi:10.4208/cicp.020215.150515sw
[18] MathWorks,The。2017年,使用MATLAB功能块模拟螺旋星系形成。统一资源定位地址http://www.mathworks.com/help/simulink/examples/spiral-galaxy-formation-simulation-using-matlab-function-blocks.html。The MathWorks,美国马萨诸塞州纳蒂克。
[19] M.Neytcheva、S.Holmgren、J.Bull、A.Dorostkar、A.Kruchinina、D.Nikitenko、N.Popova、P.Shvets、A.Teplov、V.Voevodin和V.Voeveodin。基于系统监控数据对不同应用程序进行多维性能和可扩展性分析。并行处理与应用数学,计算科学讲义。施普林格,2017年。http://dx.doi.org/10.1007/978-3-319-78024-5_37 ·doi:10.1007/978-319-78024-5\_37
[20] B.Shanker和H.Huang。加速笛卡尔展开-一种计算所有实ν的R-ν形式势的快速方法。J.计算。物理。,226(1):732-753, 2007. http://dx.doi.org/10.1016/j.jcp.2007.04.033·Zbl 1139.78009号 ·doi:10.1016/j.jp.2007.04.033
[21] J.Singh、C.Holt、J.Hennessy和A.Gupta。一种并行自适应快速多极子方法。1993年超级计算:1993年ACM/IEEE超级计算会议记录。IEEE,1993年。http://dx.doi.org/10.109/SUPERC.1993.1263424 ·doi:10.1109/SUPERC.1993.1263424
[22] H.Sundar、R.S.Sampath和G.Biros。并行线性八叉树的自底向上构造和2:1平衡求精。SIAM J.科学。计算。,30(5):2675-2708, 2008. http://dx.doi。org/10.1137/070681727·Zbl 1186.68554号 ·数字对象标识代码:10.1137/070681727
[23] A.Toomre和J.Toomre。银河桥和尾巴。《天体物理学杂志》,178:623-661972年。http://dx.doi.org/10.1086/151823 ·数字对象标识代码:10.1086/151823
[24] M.Vikram、A.Baczewzki、B.Shanker和S.Aluru。用于粒子动力学模拟的并行加速笛卡尔展开。2009年IEEE国际并行和分布式处理研讨会论文集,第1-11页,2009年。http://dx.doi.org/10.109/IPDPS.2009.5161038号·doi:10.1109/IPDPS.2009.5161038
[25] M.Warren和J.Salmon。使用层次树数据结构的天体物理N体模拟。1992年超级计算:1992年ACM/IEEE超级计算会议记录。IEEE,1992年。https://doi.org/10.109/SUPERC.1992.236647 ·doi:10.1109/SUPERC.1992.236647
[26] L.Ying、G.Biros和D.Zorin。二维和三维核相关自适应快速多极子算法。计算物理杂志,196:591-6262004。http://dx。doi.org/10.1016/j.jp.2003.11.021·Zbl 1053.65095号 ·doi:10.1016/j.jcp.2003.11.021
[27] R.横田。基于双树遍历的多核架构FMM。J.算法与计算。《技术》,2013年7月301-324日。http://dx.doi.org/10.1260/1748-3018.7.3.301 ·doi:10.1260/1748-3018.7.3.301
[28] R.Yokota和L.Barba。用CUDA进行N体模拟的树码和快速多极子方法。在W.-M.Hwu,GPU Computing Gems Emerald Edition编辑,第9章,第113-132页。摩根·考夫曼/爱思唯尔,2011年。http://dx.doi.org/10.1016/B978-0-12-384988-5.00009-7号·doi:10.1016/B978-0-12-384988-5.00009-7
[29] R.Yokota、L.Barba、T.Narumi和K.Yasuoka。在GPU上使用高度并行的快速多极子方法模拟Petascale湍流。计算机物理通信,184:445-4552013。http://dx.doi.org/10.1016/j.cpc.2012.09.011 ·doi:10.1016/j.cpc.2012.09.011
[30] R.Yokota、G.Turkiyyah和D.Keyes。快速多极子方法及其代数变体的通信复杂性。超级计算机。前面。因诺夫。,1:63-84, 2014. http://dx。doi.org/10.14529/jsfi140104·doi:10.14529/jsfi140104
[31] R.Yokota、H.Ibeid和D.Keyes。快速多极子方法作为无矩阵分层低阶近似。在T.Sakurai、S.L.Zhang、T.Imamura、Y.Yamamoto、Y.Kuramashi和T.Hoshi编辑的《EPASA 2015:特征值问题:Petascale计算中的算法、软件和应用》,计算科学与工程讲义第117卷,第267-286页。施普林格,2017年。https://doi.org/10.1007/978-3-319-62426-6_17 ·doi:10.1007/978-3-319-62426-6\_17
[32] B.Zhang、J.DeBuhr、D.Niedzielski、B.L.Silvio Mayolo和T.Sterling。分布式存储体系结构上的DASHMM加速自适应快速多极泊松-玻尔兹曼解算器。Commun公司。计算。物理。,25(4):1235-1258, 2018. http://dx.doi.org/10.4208/cicp。OA-2018-0098年·兹比尔07417534 ·doi:10.4208/cicp。OA-2018-0098
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。