×

大型(N)体仿真的并行树代码:CRAY T3D系统上的动态负载平衡和数据分布。 (英语) Zbl 0934.83053号

摘要:用于像重力这样的长距离非屏蔽交互的(N)-体算法属于一类高度不规则问题,其最优解对于当今大规模并行计算机来说是一项具有挑战性的任务。本文作者描述了一种优化内存和工作分配的策略,并将其应用于并行实现J.巴恩斯P.小屋[Nature 324,446 ff.(1986)]使用CRAFT编程环境在Cray T3D上的递归树方案。他们进行了一系列测试,以找到T3D内存中的最佳数据分布,并确定动态负载平衡策略,以便在运行大型模拟(超过1000万个粒子)时获得良好性能。测试结果表明,步长取决于两个主要因素:数据局部性和T3D网络争用。如果最近的实体(直接交互)倾向于位于相同的PE本地内存(连续的块细分,高粒度)中,而树属性具有精细的粒度分布,则可以增加数据局部性,从而使步长最小化。在一个非常大的模拟中,由于网络争用,会产生不平衡的负载。为了解决这一问题,作者设计了一种自动工作重新分配机制,该机制以微不足道的开销为代价提供了良好的动态负载平衡。

MSC公司:

83个F05 相对论宇宙学
83-08 相对论和引力理论相关问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Gouhing,X.,一个新的并行N体重力解算器:TPM,Astrophys。J.Supp.,97,884(1995)
[2] 罗密尔,D。;杜宾斯基,J。;Hernquist,L.,平行树SPH,新天文学,2277(1997)
[3] Salmon,J.,N体模拟的核心外并行方法,(第八届SIAM科学计算并行处理会议论文集(1997))
[4] 贝奇亚尼,美国。;Antonuccio-Delogu,V。;Pagliaro,A.,《工作和数据共享并行树N体代码》,J.Compute。物理学。社区。,99, 9 (1996) ·Zbl 0948.70500号
[5] Antonuccio-Delogu,V。;Becciani,U.,《异构集群的并行树N体代码》(Dongarra,J.;Wasniewsky,J.,《并行科学计算-PARA'94》(1994),Springer:Springer-Berlin),17·Zbl 0978.83500号
[6] Cray Research Inc,Cray MPP Fortran参考手册SR-2504 6.1(1994)
[7] Brooks,J.,《Cray T3D系统的单一PE优化技术》(1995年),Cray Research Inc
[8] 巴恩斯,J。;Hut,P.,《自然》,324446(1986)
[9] Cray Research Inc,Cray T3D系统架构概述,HR-04033(1993)
[10] 约翰·杜本斯基,《平行树代码》,《新天文学》,第1133期(1996年)
[11] Salmon,J.,平行树N体代码,(博士论文(1990),CALTECH)
[12] Barnes,J.,一个修改过的树代码:不要笑;它在运行,J.Comput。物理。,87, 161 (1990) ·Zbl 0689.68002号
[13] M.Gambera和U.Becciani(1997),编制中。;M.Gambera和U.Becciani(1997),正在编写中。
[14] U.Becciani、V.Antonuccio-Delogu、M.Gambera和A.Pagliaro(1997),正在编写中。;U.Becciani、V.Antonuccio-Delogu、M.Gambera和A.Pagliaro(1997),正在编写中。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。