跳到主要内容
10.1145/1188455.1188567acm会议文章/章节视图摘要出版物页面供应链会议记录会议集合
第条

MPI程序中通信相位的自适应、透明频率和电压缩放

出版:2006年11月11日 出版历史
  • 获取引文提醒
  • 摘要

    尽管高性能计算的用户对原始性能最感兴趣,但能源和功耗已成为关键问题。一些微处理器允许频率和电压缩放,这使系统能够在CPU不在关键路径上时降低CPU性能和功耗。当正确引导时,这种动态频率和电压缩放可以产生显著的能量节约,而性能损失很小。本文介绍了一个MPI运行时系统,该系统在MPI程序的通信阶段动态降低CPU性能。它动态地识别这些阶段,并在不进行分析或培训的情况下选择CPU频率,以最小化能量延迟产品。所有分析以及随后的频率和电压缩放都在MPI中,因此对应用程序完全透明。这意味着大量现有的MPI程序以及正在开发的新程序可以使用我们的系统,而无需修改。结果表明,与NAS基准测试套件相比,能量延迟产品的平均减少量为10%,平均能量减少量为12%,而平均执行时间仅增加了2.1%。

    工具书类

    [1]
    N.D.Adiga等人。BlueGene/L超级计算机概述。《超级计算》,2002年11月。]]
    [2]
    ASCI紫色基准套房。http://www.llnl.gov/asci/platiormstpurple/rfp/benchmarks/。]]
    [3]
    D.Bailey、J.Barton、T.Lasinski和H.Simon。NAS并行基准测试。RNR-91-002,NASA艾姆斯研究中心,1991年8月。]]
    [4]
    Ali Raza Butt、Chris Gniady和Y.Charlie Hu。内核预取对缓冲区缓存替换算法的性能影响。在SIGMETRICS中,第157-168页,2005年。]]
    [5]
    K.W.Cameron、X.Feng和R.Ge。性能受限的分布式dvs调度,用于在电源软件集群上的科学应用。《超级计算》,2005年11月。]]
    [6]
    恩里克·卡雷拉(Enrique V.Carrera)、爱德华多·皮涅罗(Eduardo Pinheiro)和里卡多·比安奇尼(Ricardo Bianchini)。节省网络服务器中的磁盘能量。在2003年6月举行的国际超级计算会议上。]]
    [7]
    杰弗里·蔡斯(Jeffrey S.Chase)、达雷尔·安德森(Darrell C.Anderson)、普拉奇·N·塔卡(Prachi N.Thakar)、阿明·瓦达特(Amin Vahdat)和罗纳德·多伊尔(Ronald P.Doyle)。管理托管中心的能源和服务器资源。在2001年操作系统原理研讨会上。]]
    [8]
    陈桂林、康拉德·马尔科夫斯基、马赫穆特·坎德米尔和帕德马·拉加万。通过性能限制降低并行稀疏应用程序的功耗。2005年4月,在Power-Aware Computing高性能研讨会上。]]
    [9]
    A.Dhodapkar和J.Smith。比较相位检测技术。在2003年12月举行的国际微体系结构研讨会上,第217至227页。]]
    [10]
    Elmootazbellah Elnozahy、Michael Kistler和Ramakrishnan Rajamony。web服务器的节能政策。2003年Usenix互联网技术和系统研讨会。]]
    [11]
    E.N.(Mootaz)Elnozahy、Michael Kistler和Ramakrishnan Rajamony。能效高的服务器集群。2002年2月,移动计算系统和应用研讨会。]]
    [12]
    Mark E.女性。数据中心的非均匀功率分布可安全地实现电路容量和广播吞吐量的过度规划。北卡罗来纳州立大学硕士论文,罗利,NC,2005年5月。]]
    [13]
    Vincent W.Freeh、David K.Lowenthal、Feng Pan和Nandani Kappiah。在功率可扩展集群上的MPI程序中使用多能源设备。《并行编程原理与实践》,2005年6月。]]
    [14]
    Vincent W.Freeh、David K.Lowenthal、Rob Springer、Feng Pan和Nandani Kappiah。探索功率可扩展集群上MPI程序中的能量-时间权衡。在2005年4月举行的国际并行和分布式处理研讨会上。]]
    [15]
    Chris Gniady、Ali Raza Butt和Y.Charlie Hu。缓冲区缓存中基于程序计数器的模式分类。在OSDI中,第395--408页,2004年。]]
    [16]
    Chris Gniady、Y.Charlie Hu和Yung-xiang Lu。基于程序计数器的动态电源管理技术。在HPCA中,第24-35页,2004年。]]
    [17]
    理查德·戈林。当前的物理设计工具不足。《EE时报》,2000年4月14日。]]
    [18]
    徐忠兴和冯武春。用于高性能计算的电源软件运行时系统。《超级计算》,2005年11月。]]
    [19]
    徐忠兴和冯武。通过CPU边界检测实现有效的动态电压缩放。2004年12月,IEEE/ACM第四次Power-Aware计算系统研讨会。]]
    [20]
    M.Huang、J.Renau和J.Torelas。处理器的位置适应:应用于节能。2003年6月,在计算机体系结构国际研讨会上。]]
    [21]
    Nandani Kappiah、Vincent W.Freeh和David K.Lowenthal。实时动态电压缩放:利用节点间松弛来节省MPI程序中的能量。《超级计算》,2005年11月。]]
    [22]
    查尔斯·勒弗基、卡西姆·拉贾马尼、弗里曼·劳森、韦斯·费尔特、迈克尔·基斯特勒和汤姆·W·凯勒。商用服务器的能量管理。IEEE Computer,第39-48页,2003年12月。]]
    [23]
    Athanasios E.Papathanasiou和Michael L.Scott。通过突发性提高能源效率。2003年10月,在移动计算系统和应用研讨会上。]]
    [24]
    爱德华多·皮涅罗(Eduardo Pinheiro)、里卡多·比安奇尼(Ricardo Bianchini)、恩里克·V·卡雷拉(Enrique V.Carrera)和塔利弗·希思(Taliver Heath)。基于集群的系统中的功率和性能负载平衡和不平衡。在2001年9月举行的低功耗编译器和操作系统研讨会上。]]
    [25]
    罗尔夫·拉本塞夫纳。使用硬件性能计数器自动评测MPI应用程序。在PVM/MPI中,第35-42页,1999年。]]
    [26]
    Vivek Sharma、Arun Thomas、Tarek Abdelzaher和Kevin Skadron。web服务器中的Power-aware QoS管理。在2003年12月于墨西哥坎昆举行的IEEE实时系统研讨会上。]]
    [27]
    蒂莫西·舍伍德(Timothy Sherwood)、埃雷斯·佩雷尔曼(Erez Perelman)、格雷格·哈默利(Greg Hamerly)和布拉德·考尔德(Brad Calder)。自动描述大规模程序行为。《编程语言和操作系统的体系结构支持》,2002年10月。]]
    [28]
    罗伯特·斯普林格四世(Robert C.Springer IV)、戴维·洛文塔尔(David K.Lowenthal)、巴里·朗特里(Barry Rountree)和文森特·弗里(Vincent W.Freeh)。在能量受限、功率可扩展的集群上最小化MPI程序的执行时间。在2006年3月举行的ACM并行编程原理与实践研讨会上。]]
    [29]
    M.Warren、E.Weigle和W.Feng。高密度计算:每立方米240节点beowulf。《超级计算》,2002年11月。]]
    [30]
    朱庆波(Qingbo Zhu)、弗朗西斯·戴维(Francis M.David)、克里斯托·德瓦拉吉(Christo Devaraj)、李振民(Zhenmin Li)、周媛媛(Yuanyuan Zhou)和曹培(Pei Ca。使用电源软件缓存管理降低磁盘存储的能耗。《高性能计算机体系结构》,2004年2月。]]

    引用人

    查看全部
    • (2021)分布式HPC系统中通信和计算之间的干扰第50届并行处理国际会议记录10.1145/3472456.3473516(1-11)在线发布日期:2021年8月9日
    • (2020)能效自适应消息传递轮询:在异构计算资源上的软件分布式共享内存中的应用并行与计算:实践与经验10.1002/cpe.596032:24在线发布日期:2020年8月12日
    • (2019)不同存储技术的频率缩放效率比较高性能计算研讨会论文集10.5555/3338075.3338086(1-10)在线发布日期:2019-04-29
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    SC'06:2006年ACM/IEEE超级计算会议记录
    2006年11月
    746页
    国际标准图书编号:0769527000
    内政部:10.1145/1188455
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2006年11月11日

    权限

    请求对此文章的权限。

    检查更新

    限定符

    • 第条

    会议

    SC'06年
    赞助商:
    SC’06:高性能计算、网络、存储和分析国际会议
    2006年11月11日至17日
    佛罗里达州坦帕

    接受率

    SC'06论文接受率239份中的54份,23%;
    6373份提交文件中的1516份总体接受率,24%

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)11
    • 下载次数(最近6周)1

    其他指标

    引文

    引用人

    查看全部
    • (2021)分布式HPC系统中通信和计算之间的干扰第50届并行处理国际会议论文集10.1145/3472456.3473516(1-11)在线发布日期:2021年8月9日
    • (2020)能效自适应消息传递轮询:在异构计算资源上的软件分布式共享内存中的应用并行与计算:实践与经验10.1002/cpe.596032:24在线发布日期:2020年8月12日
    • (2019)不同存储技术的频率缩放效率比较高性能计算研讨会论文集10.5555/3338075.3338086(1-10)在线发布日期:2019-04-29
    • (2018)并行应用程序的能效建模高性能计算、网络、存储和分析国际会议记录10.5555/3291656.3291679(1-13)在线发布日期:2018年11月11日
    • (2018)量子化学应用中核心和非核心频率标度模式的比较高性能计算研讨会论文集10.5555/3213069.3213082(1-11)在线发布日期:2018年4月15日
    • (2018)P换档器第27届高性能并行和分布式计算国际研讨会论文集10.1145/3208040.3208047(106-117)在线发布日期:2018年6月11日
    • (2018)并行应用程序的能效建模高性能计算、网络、存储和分析国际会议记录10.1109/SC2018.00020年10月10日(1-13)在线发布日期:2018年11月11日
    • (2017)基于应用和自动节能策略对NWChem的效果评估第25届高性能计算研讨会论文集10.5555/3108096.3108112(1-12)在线发布日期:2017年4月23日
    • (2017)并行应用程序的运行时电源节能方案国际高性能系统体系结构杂志10.1504/IJHPSA.2017.0914837:3(129-139)在线发布日期:2017年1月1日
    • (2017)提高并行计算能量效率的软件方法综述国际高性能计算应用杂志10.1177/109434201666547131:6(517-549)在线发布日期:2017年11月1日
    • 显示更多引用者

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件的形式查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    HTML格式格式

    在中查看本文HTML格式格式。

    HTML格式

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享