吴兴福;瓦莱丽·泰勒 大型多核超级计算机上MPI/OpenMP混合科学应用程序的性能建模。 (英语) Zbl 1410.68074号 J.计算。系统。科学。 79,第8期,1256-1268(2013). 摘要:本文提出了一个基于内存带宽争用时间的性能建模框架和一个参数化通信模型,用于预测OpenMP、MPI和混合应用程序在IBM POWER4、POWER5+和BlueGene/P三台大型多核超级计算机上的弱扩展性能,并分析这些MPI、OpenMP和混合应用程序的性能。我们使用STREAM内存基准测试和Intel的MPI基准测试来提供这些多核超级计算机上MPI和OpenMP应用程序的初始性能分析和模型验证,因为测量的持续内存带宽可以深入了解系统在科学应用程序上应保持的内存带宽每个核心的工作量相同。除了使用这些基准之外,我们还使用弱标度混合MPI/OpenMP大规模科学应用程序:磁聚变中的回旋动力学环形码(GTC)来验证我们在这些多核超级计算机上的混合应用程序性能模型。我们的性能建模方法的验证结果表明,在这些多核超级计算机上最多512个核上预测混合MPI/OpenMP GTC的性能时,错误率小于7.77%。 MSC公司: 68平方米 计算机系统环境下的性能评估、排队和调度 65日元10 特定类别建筑的数值算法 关键词:性能建模;MPI/OpenMP混合;多核超级计算机;内存带宽争用时间 软件:STREAM基准;英特尔MPI基准测试;NAS并行基准测试;溪流 PDF格式BibTeX公司 XML格式引用 \textit{X.Wu}和\textit{V.Taylor},J.Compute。系统。科学。79,第8号,1256--1268(2013;Zbl 1410.68074) 全文: 内政部 参考文献: [1] 阿迪安托,L。;Chapman,B.,混合MPI和OpenMP应用程序中通信和计算的性能建模,Simul。模型。实践理论,15(2007) [2] 亚历山德罗夫。;Ionescu,M。;Schauser,K。;Scheiman,C.,LogGP:将长消息合并到LogP模型中以进行并行计算,J.parallel Distrib.Comput。,44, 1 (1997) [3] 阿贡领导力计算设施BlueGene/P(无畏) [4] 艾弗莎,R。;马丁诺,B。;Rak,M。;文蒂钦克,S。;美国维拉诺,通过模拟MPI/OpenMP混合应用程序进行性能预测,并行计算。,31 (2005) [5] 巴克,K。;Davis,K。;A.海西。;Kerbyson,D。;朗,M。;Pakin,S。;Sancho,J.C.,使用性能建模设计大型系统,IEEE计算。,42、11、42-49(2009年11月) [6] 卡勒,D。;卡普,R。;帕特森,D。;Sahay,A。;桑托斯,E。;Schauser,K。;Subramonian,R。;Eicken,T.,LogP:并行计算的实用模型,Commun。ACM,39,11(1996) [8] 轩尼诗,J。;Patterson,D.,《计算机体系结构:定量方法》(2003),摩根考夫曼出版社·Zbl 0752.68014号 [9] MPI Benchmarks,Intel,Users guide and methodology description(2.3版) [10] IPM:集成性能监控 [11] 列夫斯克,J。;Larkin,J。;福斯特,M。;Glenski,J。;盖斯勒,G。;Whalen,S。;Waldecker,B。;Carter,J。;斯金纳,D。;He,H。;Wasserman,H。;沙尔夫,J。;Shan,H。;Strohmaier,E.,《理解和缓解AMD Opteron架构的多核性能问题》(2007年3月7日),LBNL-62500 [12] John D.McCalpin,《STREAM:高性能计算机中的可持续内存带宽》·Zbl 0792.76054号 [13] MuMMI项目,多指标建模基础设施(MuMMI) [14] SDSC数据星 [15] 德克萨斯农工大学超级计算机设施Hydra [16] 泰勒,瓦莱丽;吴幸福;Stevens,Rick,预言:并行和网格应用程序的性能分析和建模系统的基础设施,ACM SIGMETRICS性能评估评论,30,4,13-18(2003) [19] 吴兴福;瓦莱丽·泰勒(Valerie Taylor);活泼,查尔斯;Sharkawi,Sameh,CMP集群系统上并行科学应用程序的性能分析和优化,可扩展计算。实践经验,10,1,61-74(2009) [20] 吴兴福;Taylor,Valerie,大型多核集群上NAS并行基准SP和BT的MPI/OpenMP混合实现的性能特征,计算。J.,55,2,154-167(2012年2月) [21] 拉杰夫·塔库尔;罗尔夫·拉本塞夫纳(Rolf Rabenseifner);威廉·格罗普(William Gropp),《MPICH中集体通信操作的优化》(Optimization of collective communication operations in MPICH),国际期刊《高性能计算》。申请。,19、1、49-66(2005年春季) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。