跳到主要内容
10.1145/1183401.1183426acm会议文章/章节视图摘要出版物页面集成电路会议记录会议集合
第条

基于硬件事件预测的多线程程序在线功率性能自适应

出版:2006年6月28日 出版历史
  • 获取引文提醒
  • 摘要

    随着高端系统以多核/多线程处理器和高组件密度为特点,power-aware高性能多线程库成为系统软件堆栈的关键元素。用户级运行库中多线程代码的在线功能和性能调整是一个相对较新且尚未探索的研究领域。我们提出了一个用户级库框架,用于对多线程代码进行近乎最优的在线调整,以实现低功耗、高性能的执行。我们的框架通过在程序执行时调节并发性和更改处理器/线程配置来运行。它的创新之处在于,它使用从硬件事件驱动的评测中导出的快速运行时性能预测来选择线程粒度,以达到近乎最佳的能效点。预测器的使用大大降低了粒度控制和程序调整的运行时成本。我们的框架实现了性能和预计起飞时间2(能量延迟平方)水平:i)与oracle-derived离线预测值相当或更好;ii)明显优于使用穷举或局部线性搜索的在线预测者。完整的预测和自适应框架是在一个带有英特尔超线程处理器的真实多SMT系统上实现的,并在OpenMP程序中嵌入了自适应功能。

    工具书类

    [1]
    M.Curtis-Maury、J.Dzierwa、C.Antonopoulos和D.Nikolopoulos。新兴多处理器上高性能Power-Aware线程执行的在线策略。程序中。2006年4月在希腊罗德斯举行的第二次高性能软件计算研讨会上发表。
    [2]
    M.DeVuyst、R.Kumar和D.Tullsen。利用非平衡线程调度提高SMT处理器CMP的能量和性能。程序中。第20届IEEE/ACM国际并行和分布式处理研讨会,2006年4月,希腊罗兹。
    [3]
    L.Eeckhout和K.De Bosschere。使用商业工作量的超标量体系结构的统计模拟。程序中。2001年1月在墨西哥蒙特雷举行的第四次使用商业工作负载(与HPCA-7联合)进行计算机体系结构评估研讨会。
    [4]
    G.A.Grell、J.Dudhia和D.R.Stauffer。第五代宾州/NCAR中尺度模式(MM5)的描述。NCAR技术说明NCAR/TN-398+STR,国家大气研究中心(NCAR),1995年6月。
    [5]
    C.Isci和M.Martonosi。高端处理器的运行时功率监测:方法和经验数据。程序中。第36届ACM/IEEE微体系结构年度国际研讨会,第93-104页,加利福尼亚州圣地亚哥,2003年11月。
    [6]
    H.Jin、M.Frumkin和J.Yan。NAS并行基准测试的OpenMP实现及其性能。技术报告nas-99-011,NASA艾姆斯研究中心,1999年10月。
    [7]
    C.Jung、D.Lim、J.Lee和S.Han。SMT多处理器体系结构的自适应执行技术。程序中。第十届ACM SIGPLAN并行编程原理与实践研讨会,第236至246页,伊利诺伊州芝加哥,2005年6月。
    [8]
    R.Kalla、B.Sinharoy和J.Tendler。IBM POWER5芯片:双核多线程处理器。IEEE Micro,24(2):40-472004年3月。
    [9]
    P.Kongetira、K.Aingaran和K.Olukotun。尼亚加拉:32路多线程Sparc处理器。IEEE MICRO,25(2):21--292005年3月/4月。
    [10]
    D.库法蒂和D.马尔。Netburst微体系结构中的超线程技术。IEEE Micro,23(2):56-652003年3月。
    [11]
    J.Li和J.Martínez。片上多处理器并行计算的动态功率性能自适应。程序中。第十二届高性能计算机体系结构国际研讨会,德克萨斯州奥斯汀,2006年2月。
    [12]
    C.Liu、A.Sivasubramaniam、M.Kandimer和M.Irwin。利用障碍优化CMP的功耗。程序中。第19届国际并行和分布式处理研讨会,科罗拉多州丹佛,2005年4月。
    [13]
    J.Lo、J.Emer、H.Levy、R.Stamm、D.Tullsen和S.Eggers。通过同步多线程将线程级并行转换为指令级并行。美国计算机学会计算机系统学报,15(3):322--3531997年8月。
    [14]
    M.Martonosi、D.Brooks和P.Bose。CPU能力和性能建模与分析:指标、方法和抽象。SIGMETRICS 2001/Performance 2001-教程,2001。
    [15]
    T.Moseley、J.Kim、D.Connors和D.Grunwald。同步多线程处理器上资源争用的建模方法。程序中。2005年10月,加利福尼亚州圣何塞,2005年国际计算机设计会议,第373-380页。
    [16]
    M.Pettersson先生。Linux/x86性能计数器驱动程序。网址:http://user.it.uu.se/~mikpe/linux/perfctr/。
    [17]
    A.Snavely和D.Tullsen。同步多线程处理器的共生作业调度。程序中。第九届编程语言和操作系统体系结构支持国际会议(ASPLOS'IX),第234-244页,马萨诸塞州剑桥,2000年11月。
    [18]
    A.Weissel和F.Bellosa。过程巡航控制:用于动态电源管理的事件驱动时钟缩放。程序中。2002年嵌入式系统编译器、体系结构和Syntehsis国际会议,第238-246页,法国格勒诺布尔,2002年10月。
    [19]
    Y.Zhang和M.Voss。超线程SMP上循环调度器的运行时经验选择。2005年IEEE国际并行和分布式处理研讨会论文集,科罗拉多州丹佛,2005年4月。

    引用人

    查看全部
    • (2024)超级计算机的功耗趋势:NERSC的Cori和Perlmutter机器研究ISC高性能2024研究论文集(第39届国际会议)10.23919/ISC.2024.10528943(1-10)在线发布日期:2024年5月
    • (2024)通过动态内核绑定优化系统利用效率亚太地区高性能计算国际会议论文集10.1145/3636480.3637221(77-82)在线发布日期:2024年1月11日
    • (2024)用于优化云服务器并行计算的神经网络框架系统体系结构杂志2016年10月10日/j.sysarc.2024.103131150(103131)在线发布日期:2024年5月
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    ICS’06:第20届超级计算国际年会会议记录
    2006年6月
    385页
    国际标准图书编号:1595932828
    内政部:10.1145/1183401
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2006年6月28日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 硬件性能计数器
    2. 在线适应
    3. 性能预测
    4. power-aware计算

    限定符

    • 第条

    会议

    ICS06系列
    ICS06:2006年国际超级计算大会
    2006年6月28日至7月1日
    昆士兰、凯恩斯、澳大利亚

    接受率

    ICS’06论文接受率141份提交文件中的37份,26%;
    2180份提交文件的总体接受率为629份,占29%

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)16
    • 下载次数(最近6周)5

    其他指标

    引文

    引用人

    查看全部
    • (2024)超级计算机的功耗趋势:NERSC的Cori和Perlmutter机器研究ISC高性能2024研究论文集(第39届国际会议)10.23919/ISC.2024.10528943(1-10)在线发布日期:2024年5月
    • (2024)通过动态核心绑定优化系统利用效率亚太地区高性能计算国际会议论文集10.1145/3636480.3637221(77-82)在线发布日期:2024年1月11日
    • (2024)用于优化云服务器并行计算的神经网络框架系统体系结构杂志2016年10月10日/j.sysarc.2024.103131150(103131)在线发布日期:2024年5月
    • (2023)预测;在GPU中启用高效的细粒度DVFS不起作用第28届ACM编程语言和操作系统体系结构支持国际会议记录,第4卷10.1145/3623278.3624756(253-267)在线发布日期:2023年3月25日
    • (2023)使可爆容器适应可变CPU资源电气电子工程师学会计算机期刊10.1109/TC.2022.3174480号72:3(614-626)在线发布日期:2023年3月1日
    • (2023)用于MPI/OpenMP并行应用程序负载平衡的动态内核绑定计算科学–ICCS 202310.1007/978-3-031-36024-4_30(378-394)在线发布日期:2023年6月26日
    • (2022)在线线程自动调整以提高性能和节省资源IEEE并行和分布式系统汇刊10.1109/TPDS.2022.3169410号33:12(3746-3759)在线发布日期:2022年12月1日
    • (2022)提高高性能计算中图形算法的执行效率并行与计算:实践与经验10.1002/cpe.741935:18在线发布日期:2022年11月
    • (2021)基于任务的编程模型中动态并发限制与电压频率缩放的结合第50届并行处理国际会议论文集10.1145/3472456.3472471(1-11)在线发布日期:2021年8月9日
    • (2021)墨鱼高性能计算、网络、存储和分析国际会议记录10.1145/3458817.3476163(1-14)在线发布日期:2021年11月14日
    • 显示更多引用者

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    视图选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享