×

基于RDMA的互连的推测性和自适应MPI会合协议。 (英语) Zbl 1191.68077号

摘要:将计算与通信重叠是隐藏通信延迟对并行应用程序性能影响的关键技术。消息传递接口(MPI)是用于高性能计算的广泛使用的消息传递标准。实现良好重叠水平的最重要因素之一是MPI能够在出色的通信操作上取得进展。在本文中,我们提出了一种新的推测性MPI Rendezvous协议,该协议使用RDMA Read和RDMA Write来有效地提高通信进度,从而提高重叠能力。基于改进的MPICH2实现在10-Gigabit iWARP以太网上的性能结果表明,在接收器端重叠和进展能力方面有了显著改善(80–100)。我们还观察到一些NPB应用程序和RADIX应用程序的应用程序等待时间提高了30%。对于没有从该协议中受益的应用程序,使用了一种自适应机制来停止推测,以有效减少协议开销。

MSC公司:

68个M12 网络协议
68M10个 计算机系统中的网络设计和通信
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] MPI:消息传递接口标准,MPI论坛(1997)
[2] Goumas,G.、Sotiropoulos,A.、Koziris,N.:在计算和通信重叠的情况下,最小化循环平铺的完成时间。摘自:第15届IEEE/ACM国际并行和分布式处理研讨会论文集(IPDPS’01)(2001年)。doi:10.1109/IPDPS.2001.924976·Zbl 1121.68344号
[3] Fishgold,L.,Danalis,A.,Pollock,L.,Swany,M.:一种改进集群中通信计算重叠的自动化方法。2006年NSF新一代软件研讨会(NSFNGS 2006)。第20届IEEE/ACM国际并行和分布式处理研讨会论文集(IPDPS'06)(2006年)。doi:10.1109/IPDPS.2006.1639590
[4] Brightwell R.、Riesen R.、Underwood K.D.:分析消息传递接口应用程序的重叠、卸载和独立进程的影响。国际期刊高性能计算。申请。19(2), 103–117 (2005). doi:10.1177/1094342005054257·doi:10.1177/1094342005054257
[5] Rashti,M.J.,Afsahi,A.:评估现代互连中计算/通信重叠和通信进展的能力。摘自:第15届IEEE高性能互连研讨会论文集(2007年热互连),第117-124页(2007年)。doi:10.1109/HOTI.2007.12
[6] Wagner,A.、Jin,H.、Panda,D.K.、Riesen,R.:Myrinet集群基于NIC的动态用户定义模块卸载。摘自:第六届IEEE集群计算国际会议论文集(2004),第205-214页(2004)。doi:10.1109/CLUSTR.2004.1392618
[7] Sitsky,D.,Hayashi,K.:富士通AP1000+使用轮询、中断和远程复制的MPI库。摘自:《并行架构、算法和网络国际研讨会论文集》,第43-49页(1996年)。doi:10.1109/ISPAN.1996.508959
[8] Sur,S.,Jin,H.,Chai,L.,Panda,D.K.:InfiniBand上MPI基于RDMA读取的会合协议:设计备选方案和优点。摘自:第11届ACM SIGPLAN并行编程原理与实践研讨会论文集(PPoPP 2006),第32–39页(2006)。数字对象标识代码:10.1145/1122971.1122978
[9] Trahay,F.、Denis,A.、Aumage,O.、Namyst,R.:使用通用I/O管理器改进MPI中的反应性和通信重叠。摘自:《2007年欧洲PVM/MPI会议录》,LNCS 4757,第170–177页(2007)
[10] MPICH2:http://www-unix.mcs.anl.gov/mpi/mpich2/ ·Zbl 1015.68728号
[11] Rashti,M.J.、Afsahi,A.:10千兆iWARP以太网:与InfiniBand和Myrinet-10G的性能对比分析。摘自:IEEE集群通信体系结构第七届研讨会(CAC'07)。第21届IEEE/ACM国际并行和分布式处理研讨会论文集(IPDPS’07)(2007)。doi:10.10109/IPDPS.2007.370480
[12] Rashti,M.J.,Afsahi,A.:通过支持RDMA的互连改进MPI Rendezvous协议中的通信进度和重叠。摘自:《第22届高性能计算系统和应用国际研讨会论文集》(HPCS 2008),第95-101页(2008)。doi:10.1109/HPCS.2008.10
[13] 美国国家航空航天局(NASA):MPI的NAS平行基准(NPB),http://www.nas.nasa.gov/Resources/Software/npb.html/
[14] Shan H.、Singh J.P.、Oliker L.、Biswas R.:SMP集群上的消息传递和共享地址空间并行。J.并行计算。29(2), 167–186 (2003). doi:10.1016/S0167-8191(02)00222-3·doi:10.1016/S0167-8191(02)00222-3
[15] Petrini F.,Coll S.,Frachtenberg E.,Hoisie A.:Quadrics互连网络的性能评估。集群计算。6(2), 125–142 (2003). doi:10.1023/A:1022852505633·doi:10.1023/A:1022852505633
[16] Brightwell,R.、Doerfler,D.、Underwood,K.D.:4X InfiniBand和Quadrics ela-4技术的比较。摘自:第六届IEEE集群计算国际会议论文集(Cluster’04),第193-204页(2004)。doi:10.1109/CLUSTR.2004.1392617
[17] InfiniBand贸易协会,InfiniBand架构规范,第1卷,2004年10月
[18] Beecroft J.、Addison D.、Hewson D.、McLaren M.、Roweth D.、Petrini F.、Nieplocha J.:QsNetII:定义高性能网络设计。IEEE Micro 25(4),34–47(2005)。doi:10.1109/MM.2005.75·doi:10.1109/MM.2005.75
[19] Doerfler,D.,Brightwell,R.:测量MPI发送和接收开销以及高性能网络接口中的应用程序可用性。摘自:EuroPVM/MPI 2006年会议记录,LNCS 4192,第331–338页(2006)
[20] Liu,J.、Chandrasekaran,B.、Wu,J..、Jiang,W.、Kini,S.、Yu,W.,Buntinas,D.、Wyckoff,P.、Panda,D.K.:InfiniBand、Myrinet和Quadrics上MPI实现的性能比较。2003年ACM/IEEE超级计算会议论文集(SC 2003)(2003)。doi:10.1109/SC.2003.10007
[21] Zamani,R.,Qian,Y.,Afsahi,A.:Myrinet/GM2双端口网络的评估。参见:第三届IEEE高速本地网络研讨会(HSLN 2004)。2004年国际局域网会议记录(LCN 2004),第734–742页(2004)。doi:10.1109/LCN.2004.20
[22] Mellanox Technologies公司:网址:http://www.mellanox.com/
[23] 米里科姆。http://www.myricom.com网站/
[24] NetEffect,Inc.:NetEffect-NE020 10Gb iWARP以太网通道适配器。http://www.neteffect.com网站/
[25] RDMA联盟:iWARP协议规范,http://www.rdmaconsortium.org/
[26] Amerson,G.,Apon,A.:使用虚拟接口体系结构的网络消息传递模块的实现和设计分析。摘自:第六届IEEE集群计算国际会议论文集(2004年),第255-265页(2004)。doi:10.1109/CLUSTR.2004.1392623
[27] MVAPICH公司:http://mvapich.cse.ohio-state.edu/index.shtml/
[28] Kumar,R.、Mamidala,A.R.、Koop,M.J.、Santhanaraman,G.、Panda,D.K.:MPI点对点通信的无锁异步集合设计。摘自:《2008年欧洲PVM/MPI会议录》,LNCS 5205,第185-193页(2008年)
[29] Pakin,S.:接收机发起的消息通过RDMA网络传递。摘自:第22届IEEE国际并行和分布式处理研讨会论文集(IPDPS 2008)(2008)。doi:10.10109/IPDPS.2008.4536262
[30] Chen T.、Raghavan R.、Dale J.N.、Iwata E.:蜂窝宽带引擎架构及其首次实现——性能视图。IBM J.Res.Develop公司。51(5), 559–572 (2007) ·doi:10.1147/rd.515.0559
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。