艾坦·扎哈维 Fat-tree路由和节点排序为MPI全局集合提供无争用流量。 (英语) Zbl 1248.68071号 J.平行分布计算。 72,第11期,1423-1432(2012). 摘要:随着高性能计算集群规模的增长,互连热点降低网络延迟和有效带宽的可能性也在增加。本文提出了一种解决现实生活中恒定二分带宽fat-tree拓扑可伸缩性问题的方法。结果表明,对于MPI全局集合流量,可以实现最大带宽和穿透延迟。为了形成这样一个无拥塞的配置,MPI程序应该利用集体通信,MPI-node-order应该是拓扑感知的,并且数据包路由应该与MPI通信模式匹配。首先,我们表明MPI集合可以分为单向和双向移位。利用这一特性,我们提出了一个在运行单个作业的完全和部分填充的胖树中全局集合的无拥塞路由方案。然后,通过应用一些作业大小和位置限制,可以获得在同一个脂肪树上运行的多个作业的无控制结果。提出的路由、MPI节点阶数和通信模式的仿真结果表明,无争用现象,与之前发布的所有集合的结果相比,吞吐量提高了40%。 引用于1文件 MSC公司: 68M10个 计算机系统中的网络设计和通信 68米14 分布式系统 关键词:网络拓扑;路由算法与技术;集体沟通 软件:开放式多媒体接口;OMNet公司++ PDF格式BibTeX公司 XML格式引用 \textit{E.Zahavi},J.平行分布。计算。72,第11号,1423-1432(2012;Zbl 1248.68071) 全文: 内政部 参考文献: [1] H.J.Alme,A.Hoisie,F.Petrini,H.J.Wasserman,M.L.Gittings,D.J.Kerbyson,《大规模应用程序的预测性能和可扩展性建模》,SC'01,丹佛,科罗拉多州,2001年。 [2] Wolfgang E.Denzel,Jian Li,Peter Walker,Yuho Jin,高性能计算系统端到端仿真框架,收录于:2008年3月3日至7日在法国马赛举行的第一届通信、网络和系统仿真工具和技术国际会议论文集。 [3] Dongarra,J.J。;Otto,S.W。;斯尼尔,M。;Walker,D.:MPP和工作站的消息传递标准,ACM通信39,第7期,84-90(1996) [4] C.Gomez、F.Gilabert、M.E.Gomez和P.Lopez、J.Duato,《确定与自适应路径在树结构中的比较》,收录于:IEEE国际并行与分布式处理研讨会,IPDPS’07,2007年,第292页。 [5] 博尔丁,K。;Synder,L.:CM-5数据路由器上的无拥塞路由,第一届国际研讨会PCRCW 853176-184(1994) [6] Torsten Hoefler,Timo Schneider,Andrew Lumsdaine,多级交换机不是交叉杆:高性能网络中静态路由的影响,收录于:集群计算,IEEE国际会议,2008年,第116-125页。 [8] D.J.Kerbyson,K.J.Barker,通过模板自动识别应用程序通信模式,收录于:并行和分布式计算系统国际会议,PDCS,内华达州拉斯维加斯,2005年。 [9] Sameer Kumar,Laxmikant V.Kale,在脂肪树网络上扩展全对多播,收录于:《并行和分布式系统学报》,第十届国际会议,2004年,第205页。 [10] Leiserson,C.E.:Fat-trees:硬件高效超级计算的通用网络,IEEE计算机事务34,第10期,892-901(1985) [11] Sabine R.Õhring,Maximilian Ibel,Sajal K.Das,Mohan J.Kumar,《广义脂肪树》,载于:第九届并行处理国际研讨会论文集,1995年4月25日至28日,第37页。 [12] OMNeT++:一个可扩展的、模块化的、基于组件的C++仿真库和框架。http://www.omnetpp.org/。 [13] Open Fabrics Alliance下载软件包页面:http://www.openfabrics.org/downloads/ibutils/。 [14] 调优集合层的OpenMPI实现:http://svn.open-MPI.org/svn/oMPI/trunk/oMPI/mca/coll/tuned/。 [15] J.Petrini、E.Fernandez、S.Frachtenberg、F.Coll,《ASCI q机器上的可扩展集体通信》,《热互连》,2003年8月12日。 [16] Fabrizio Petrini,Marco Vanneschi,k元n树:大规模并行体系结构的高性能网络,载于:第11届国际并行处理研讨会,IPPS’97,IPPS,1997年第87页·Zbl 1319.68043号 [17] J.Pjesivac-Grbovic,T.Angskun,G.Bosilca,G.E.Fagg,E.Gabriel,J.J.Dongarra,MPI集体操作的性能分析,摘自:第19届国际并行和分布式处理研讨会论文集,第四届性能建模、评估国际研讨会,和并行和分布式系统优化PMEO-PDS 05,丹佛,科罗拉多州,2005年4月。 [18] Thakur,R。;Rabenseifner,R。;Gropp,W.:MPICH中集体通信操作的优化,《国际高性能计算应用杂志》19,第1期,49-66(2005) [19] 林选毅、钟业钦、黄。Tai-Yi,基于fat-tree的infiniband网络的多LID路由方案,收录于:IEEE国际并行和分布式处理研讨会,IPDPS’04,2004年,第1-13页。 [20] Xin Yuan,使用2级广义脂肪树拓扑改善InfiniBand网络的路由性能,第一届可扩展系统通信体系结构研讨会,2010年5月。 [21] E.Zahavi,D-Mod-K路由为现实生活中的胖树上的移位排列提供非阻塞流量,技术报告CCIT报告7762010年8月。 [22] 埃坦·扎哈维;格雷戈里·约翰逊(Gregory Johnson);Darren J.Kerbyson。;Michael Lang:针对移位全对全通信模式的优化infiniband fat-tree路由,并发计算实践和经验22,第2期,217-231(2009) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。