×

将多个结构化网格PDE应用程序的共数组Fortran(CAF)与MPI进行比较。 (英语) Zbl 1349.76606号

摘要:基于语言的并行方法已纳入Fortran标准。这些Fortran扩展名为Coarray Fortran(CAF),Cray和Intel提供了支持CAF的全功能编译器;GNU预计将于2015年实施。CAF将表达式的优雅性与实现的简单性结合起来,形成了一种高效的并行编程语言。表达式的优雅导致了非常紧凑的并行代码。标准的存在有助于提高可移植性和可维护性。CAF被设计为擅长单面通信,支持单面通信的类似功能也在最新的MPI-3标准中可用。预计单面通信对于涉及偏微分方程的结构化网格应用以及其他可能的应用非常有价值。本文重点比较了CAF和MPI的一些非常有用的应用领域,这些领域通常用于在结构化网格上求解偏微分方程。这三个具体领域是快速傅里叶技术、计算流体动力学和多重网格方法。对于每个应用领域,我们都开发了基于MPI-3单边消息传递功能的优化CAF代码和优化MPI代码。在多达65536个处理器上,对CAF和MPI-3进行了弱可伸缩性比较研究。这两种范式都可以很好地扩展,表明它们非常适合Petascale-class应用程序。所示的一些应用程序(如快速傅里叶技术和计算流体动力学)需要大型粗粒度消息传递。此类应用强调高带宽。我们的另一个应用程序(Multigrid Methods)使用逐点平滑器,这需要大量细粒度消息传递。在这种应用中,对低延迟的要求很高。我们的研究表明,对于所有大小的消息,CAF和MPI-3都具有高带宽和低延迟的双重优势。即使对于大量处理器,CAF也可以与MPI-3媲美,或者显示出比MPI-3稍有优势。与MPI-2相比,CAF和MPI-3都具有显著优势。除了弱可伸缩性研究之外,我们还列出了一些我们在CAF和MPI-3中成功实现单边消息传递的最佳使用策略。我们表明,CAF代码当然更容易编写和维护,更简单的语法使并行性更容易理解。

MSC公司:

76米25 其他数值方法(流体力学)(MSC2010)
2005年5月 并行数值计算
68甲15 编程语言理论
76-04 流体力学相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Balsara,D.S.,《无发散重建磁流体动力学的二阶精确方案》,天体物理学。补充期刊。,151, 149-184 (2004)
[2] Balsara,D.S.,磁场的无散度重建和磁流体力学的WENO方案,J.Compute。物理。,228, 5040-5056 (2009) ·Zbl 1280.76030号
[3] Balsara,D.S.,《流体力学和磁流体力学的自调整、保正高阶格式》,J.Compute。物理。,231, 7504-7517 (2012)
[4] 白求恩,我。;公牛,J.M。;新泽西州丁格尔。;Higham,N.J.,MPI、SHMEM和OpenMP中实现的异步Jacobi方法的性能分析,Int.J.High Perform.Comput。申请。,28, 1, 97-111 (2014)
[5] Brandt,A.,边界值问题的多级自适应解决方案,数学。计算。,31, 333-390 (1977) ·Zbl 0373.65054号
[6] Brandt,A.,《偏微分方程的多级自适应技术:思想和软件》,(数学软件III(1977),学术出版社:纽约学术出版社),277-318·Zbl 0407.68037号
[7] 布里格斯,W。;亨森,V.E。;McCormick,S.,《多重网格教程》(2000),SIAM·Zbl 0958.65128号
[8] Canuto,C.,流体动力学中的谱方法,Springer Ser。计算。物理学。(1991),斯普林格·弗拉格·Zbl 0717.76004号
[9] 卡努托,C。;侯赛尼,M。;Quarteroni,A。;Zang,T.,流体动力学中的谱方法(1993),Springer-Verlag
[10] Fanfarillo,A。;Burnus,T。;卡德里尼,V。;Filippone,S。;Nagle,D。;Rouson,D.,OpenCoarrays:支持coarray Fortran编译器的开源传输层,会议论文,PGAS 2014
[11] 格拉莫利,V。;Harmanci,D.,《关于事务性记忆的输入接受》,《并行过程》。莱特。,20, 1, 31-50 (2010)
[12] 格罗普,W。;Lusk,E。;Skjellum,A.,《使用MPI:具有消息传递接口的可移植并行编程》(1999),麻省理工学院出版社
[13] Lele,S.K.,具有光谱分辨率的紧凑有限差分格式,J.Compute。物理。,103, 16-42 (1992) ·Zbl 0759.65006号
[14] 梅特卡夫,M。;Reid,J。;Cohen,M.,《现代Fortran解释》(2011),牛津大学出版社·Zbl 1244.68002号
[15] (2012),MPI Forum 2012,MPI:消息传递接口标准,3.0版
[16] Numrich,R.W。;Reid,J。;Kim,K.,使用联合数组Fortran编写多重网格解算器,(应用并行计算大规模科学和工业问题。应用并行计算大型科学和工业难题,Lect.Notes Compute.Sci.,vol.1541(1998)),390-399
[17] Temperton,C.,ANY(N=(2^P)(3^Q)(5^R)的广义素因子FFT算法,SIAM J.Sci。统计计算。,13676-686(1992年5月)·Zbl 0756.65163号
[18] 美国特罗滕贝格。;Oosterlee,C。;Schuler,A.,Multigrid(2001),爱思唯尔学术出版社·Zbl 0976.65106号
[19] 杨,C。;布兰德,W。;Mellor-Crummey,J。;Balaji,P.,便携式MPI-interoperable coarray Fortran,(第19届ACM SIGPLAN并行编程原理与实践研讨会论文集。第19届APM SIGPLAN并行编程原理和实践研讨会论文集中,PPoPP'14(2014)),81-92
[20] Yavneh,I.,应用于一类椭圆算子的红-黑高斯-赛德尔松弛的多重网格平滑因子,SIAM J.Numer。分析。,32, 1126-1138 (1995) ·Zbl 0834.65114号
[21] Yavneh,I.,关于多重网格中的红黑SOR平滑,SIAM J.Sci。计算。,17, 180-192 (1996) ·Zbl 0845.65013号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。