跳到主要内容
10.1145/3281070.3281071acm会议文章/章节视图摘要出版物页面泼洒会议记录会议集合
研究论文

PIRA:性能仪表优化自动化

出版:2018年11月6日 出版历史
  • 获取引文提醒
  • 摘要

    在本文中,我们介绍了PIRA——一种用于性能分析的自动仪器优化基础设施。它自动生成初始性能概述度量,并根据记录的运行时信息逐步对其进行优化。这可以帮助性能分析人员完成选择要在后续测量中捕获哪些功能的耗时且主要是手动但机械的任务。PIRA实施了一个现有的聚合策略,该策略通过试探性的方法确定初始概览度量要包含哪些函数。此外,它实现了一种新开发的启发式方法,只在热点区域合并配置文件信息并扩展仪器。该方法在不同的基准上进行了评估,包括SU 2多物理解算器包。PIRA能够生成包含应用程序热点的仪器配置,但与Score-P参考度量相比,产生的开销要少得多。

    工具书类

    [1]
    Laksono Adhianto、Sinchan Banerjee、Mike Fagan、Mark Krentel、Gabriel Marin、John Mellor-Crummey和Nathan R Tallent。2010.HPCToolkit:用于优化并行程序性能分析的工具。并发与计算:实践与经验。22, 6 (2010), 685–701.
    [2]
    迪特尔·安·梅(Dieter an Mey)、斯科特·比尔斯多夫(Scott Biersdorf)、克里斯蒂安·比肖夫(Christian Bischof)、凯·迪特尔姆(Kai Diethelm)、多米尼克·埃什韦勒(Dominic Eschweiler)、迈克尔·格恩特(Michael Gerndt)、安德烈亚斯·科恩普费尔(Andreas Knüpfer)、丹尼尔·洛伦茨(Daniel Lorenz)、艾伦·马洛尼(Allen Malony)、沃尔夫冈·内格尔(Wolfgan。2011年,Score-P:Petascale应用程序的统一性能测量系统。2010年高性能计算能力。Springer Science+Business Media,85–97。
    [3]
    马丁·伯彻尔、拜恩·多·金、杰夫·戴蒙德、约翰·麦卡宾、拉尔斯·科斯特克和詹姆斯·布朗。2010.PerfExpert:HPC应用程序的易于使用的性能诊断工具。程序中。2010年ACM/IEEE高性能计算、网络、存储和分析国际会议(SC'10)。IEEE计算机学会,美国华盛顿特区,1-11。
    [4]
    亚历山德鲁·卡洛托乌(Alexandru Calotiu)、托尔斯滕·霍夫勒(Torsten Hoefler)、马吕斯·波克(Marius Poke)和菲利克斯·沃尔夫(Felix Wolf)。2013.使用自动性能建模查找复杂代码中的可扩展性错误。《高性能计算、网络、存储和分析国际会议论文集》(SC'13)。ACM,美国纽约州纽约市,第45条,共12页。
    [5]
    巴勃罗·德·奥利维拉·卡斯特罗、查迪·阿克尔、埃里克·佩蒂特、米哈伊尔·波波夫和威廉·贾尔比。2015年,CERE:LLVM-Based Codelet Extractor and RE-player for Piecewise Benchmarking and Optimization(CERE):基于LLVM-的代码片段提取程序和分段基准测试与优化重塑程序。ACM事务处理。阿基特。代码优化。第12、1条,第6条(2015年4月),共24页。
    [6]
    托马斯·D·埃科诺蒙、弗朗西斯科·帕拉西奥斯、肖恩·科普兰、特伦特·卢卡奇克和胡安·阿隆索。2015年,SU2:用于多物理模拟和设计的开源套件。AIAA Journal 54,3(2015),828–846。
    [7]
    Markus Geimer、Felix Wolf、Brian J.N.Wylie、ErikaÁbrahám、Daniel Becker和Bernd Mohr。2010.Scalasca性能工具集体系结构。并发与计算:实践与经验22,6(2010),702–719。
    [8]
    艾特金·格尔、乔纳森·胡、艾尔穆斯塔法·乌尔德·阿赫迈德·瓦尔和亚历山大·卡林金。2017.高性能计算架构遗留开源CFD代码的现代化和优化。国际计算流体动力学杂志31,2(2017),122–133。
    [9]
    朱利安·哈默(Julian Hammer)、乔治·海格(Georg Hager)、扬·艾辛格(Jan Eitzinger)和格哈德·韦林(Gerhard Wellein)。2015.使用Kerncraft进行自动循环内核分析和性能建模。程序中。第六届高性能计算系统性能建模、基准测试和仿真国际研讨会(PMBS’15)。ACM,美国纽约州纽约市,第4条,共11页。
    [10]
    约翰·汉宁(John L.Henning)。2006.SPEC CPU2006基准测试描述。ACM SIGARCH计算机体系结构新闻。34, 4 (2006), 1–17.
    [11]
    克里斯蒂安·伊万斯基(Christian Iwainsky)。2015.InstRO:基于组件的性能检测工具。博士论文。达姆施塔特科技大学。
    [12]
    克里斯蒂安·伊温斯基(Christian Iwainsky)、拉尔夫·阿尔滕菲尔德(Ralph Altenfeld)、迪特尔·安·梅伊(Dieter an Mey)和克里斯蒂安·布肖夫(Christial Bischof)。2011.通过性能调整工作流程提高智能软件生产效率。2011年欧洲汽车展:平行加工车间。施普林格,198-207。
    [13]
    Christian Iwainsky和Christian Bischof。2016年,用于低水头测量的Calltree-Controlled仪器。2016年IEEE国际并行和分布式处理研讨会(IPDPSW)。IEEE,美国伊利诺伊州芝加哥,1668-1677年。
    [14]
    亚历山德拉·金博勒、路易斯·马斯特兰格洛、文森特·洛克纳和菲利普·克劳斯。2012.VMAD:高级动态程序分析;仪器框架。在CC-21编译器构造国际会议(计算机科学讲稿),M.O'Boyle(编辑),第7210卷。爱沙尼亚塔林斯普林格,220-237。
    [15]
    Jan-Patrick Lehr、Christian Iwainsky和Christian Bischof。2017.HPCToolkit和Score-p对硬件性能计数器的影响。程序中。第四届ACM SIGPLAN并行系统软件工程国际研讨会(SEPS 2017)。ACM,美国纽约州纽约市,21-30。
    [16]
    巴顿·P·米勒(Barton P.Miller)、马克·D·卡拉汉(Mark D.Callaghan)、乔纳森·卡吉尔(Jonathan M.Cargille)、霍林斯沃斯·杰弗里·K(Hollingsworth Jeffrey K.)、R·布鲁斯·欧文(R.Bruce Irvin)、凯伦·卡拉瓦尼克(Karen L。1995年,Paradyn并行性能测量工具。计算机28,11(1995年11月),37–46。
    [17]
    伯恩德·莫尔(Bernd Mohr)、弗拉基米尔·沃沃丁(Vladimir Voevodin)、朱迪特·吉梅内斯(Judit Giménez)、埃里克·哈格斯滕(Erik Hagersten)、安德烈亚斯·库普费尔(Andreas Knüpfer)、德米特里·尼基滕科(Dmitry A.Nikitenko)、马特·尼尔森(Mats Nilsson)、哈拉尔德·塞瓦特。2013年,HOPSA工作流程和工具。在Tools for High Performance Computing 2012中。斯普林格。
    [18]
    A.Morajko、P.Caymes-Scutari、T.Margalef和E.Luque。2007.MATE:并行/分布式应用程序的监视、分析和调整环境。并发与计算:实践与经验19,11(2007),1517-1531。
    [19]
    马蒂亚斯·穆勒(Matthias S.Muller)、马蒂杰斯·范·韦弗伦(Matthijs van Waveren)、罗恩·利伯曼(Ron Lieberman)、布莱恩·惠特尼(Brian Whitney)、斋藤(Hideki Saito)、卡利安·库马兰(Kalyan Kumaran)、约翰·巴伦(John Baron)、威廉·布兰特利(William C.Brant。2009年。SPEC MPI2007–使用MPI的并行系统的应用程序基准测试套件。并发与计算:实践与经验22,2(2009),191-205。
    [20]
    Jan Mußler、Daniel Lorenz和Felix Wolf。2011.使用事先静态分析降低直接应用仪表的开销。2011年Euro-Par并行处理。斯普林格。
    [21]
    菲利普·罗斯(Philip C.Roth)、洪章珊(Hongzhang Shan)、大卫·里格纳(David Riegner)、尼古拉斯·安托林(Nikolas Antolin)、萨拉特·斯利帕蒂(Sarat Sreepathi)、列奥尼德·奥利克(Leonid Oliker)、塞缪尔·威廉姆斯(Samuel Wil。2017年,RAMPAGE金属合金电势生成软件的性能分析和优化。程序中。第四届ACM SIGPLAN并行系统软件工程国际研讨会(SEPS 2017)。ACM,美国纽约州纽约市,11–20。
    [22]
    德克·施密德、彼得·菲利普、丹尼尔·洛伦茨、克里斯蒂安·罗塞尔、马库斯·盖默、迪特安·梅伊、伯恩德·莫尔和菲利克斯·沃尔夫。2012.基于任务的OpenMP应用程序的性能分析技术。在异构世界中的OpenMP中。Springer Science+Business Media,196-209。

    引用人

    查看全部
    • (2023)通过热点检测和OpenMP开销分析对并行化代码区域进行筛选和排序高性能计算、网络、存储和分析国际会议SC’23研讨会会议记录10.1145/3624062.3624206(1368-1379)在线发布日期:2023年11月12日
    • (2023)运行时自适应选择性性能检测2023 IEEE国际并行和分布式处理研讨会(IPDPSW)10.1109/IPDPSW59300.2023.00073(423-432)在线发布日期:2023年5月
    • (2023)面向大规模C++代码的编译器辅助工具选择高性能计算。ISC高性能2022国际研讨会10.1007/978-3-031-23220-6_1(5-19)在线发布日期:2023年1月4日
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布时间

    封面图片ACM会议
    AI-SEPS 2018:第五届ACM SIGPLAN软件工程和并行计算系统人工智能和经验方法国际研讨会会议记录
    2018年11月
    15页
    国际标准图书编号:9781450360678
    内政部:10.1145/3281070
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人拥有的本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表,需要事先获得特定许可和/或收取费用。向请求权限[电子邮件保护].

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2018年11月6日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 得分-P
    2. 自动程序仪表
    3. 高性能计算
    4. 性能工程

    限定符

    • 研究文章

    会议

    18年溅落
    赞助商:
    SPLASH’18:系统、编程、语言和应用会议:人类软件
    2018年11月6日
    马萨诸塞州,美国波士顿

    即将召开的会议

    24年飞溅
    ACM SIGPLAN系统、编程、语言和应用国际会议:人文软件
    2024年10月20日至25日
    帕萨迪纳,加利福尼亚州,美国

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)23
    • 下载次数(最近6周)

    其他指标

    引文

    引用人

    查看全部
    • (2023)通过热点检测和OpenMP开销分析对并行化代码区域进行筛选和排序高性能计算、网络、存储和分析国际会议SC’23研讨会会议记录10.1145/3624062.3624206(1368-1379)在线发布日期:2023年11月12日
    • (2023)运行时自适应选择性性能检测2023 IEEE国际并行和分布式处理研讨会(IPDPSW)10.1109/IPDPSW59300.2023.00073(423-432)在线发布日期:2023年5月
    • (2023)大规模C++代码的编译器辅助检测选择高性能计算。ISC高性能2022国际研讨会10.1007/978-3-031-23220-6_1(5-19)在线发布日期:2023年1月4日
    • (2021)工具支持的小应用程序提取,便于程序分析和并行化第50届并行处理国际会议记录10.1145/3472456.3472521(1-10)在线发布日期:2021年8月9日
    • (2021)MPI应用程序中的低水头负载不平衡自动检测Euro-Par 2021:并行处理10.1007/978-3-030-85665-6_2(19-34)在线发布日期:2021年8月25日
    • (2021)SimAnMo-A并行运行时模型生成器并行与计算:实践与经验10.1002/cpe.677134:20在线发布日期:2021年12月14日
    • (2020)利用混合云HPC和多层反应式编程2020 IEEE/ACM超级计算与云技术互操作性国际研讨会(SuperCompCloud)10.1109/超级CompCloud51944.2020.00010(27-32)在线发布日期:2020年11月
    • (2020)面向编译器辅助的伴随MPI应用程序正确性检查2020 IEEE/ACM第四届HPC应用软件正确性国际研讨会(正确性)10.1109/更正51934.2020.00010(40-48)在线发布日期:2020年11月
    • (2019)用于经验性能建模的自动仪器改进2019 IEEE/ACM编程和性能可视化工具国际研讨会(ProTools)10.1109/专业工具49597.2019.00011(40-47)在线发布日期:2019年11月

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享