研究论文

公共访问

快速调谐的自举参数空间探索

作者：
贾亚拉曼·J·蒂亚加拉扬

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
尼基尔·贾恩

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
拉西尔·阿尼鲁德

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
阿尔弗雷多·吉梅内兹

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
拉胡尔·斯里达尔

加州大学欧文分校

加州大学欧文分校
查看个人资料

,
阿尼鲁达·马拉特

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
王涛（音译）

北卡罗来纳州立大学

北卡罗来纳州立大学
查看个人资料

,
穆拉利·埃马尼

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
Abhinav Bhatele公司

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

,
托德·甘布林

劳伦斯·利弗莫尔国家实验室

劳伦斯·利弗莫尔国家实验室
查看个人资料

作者信息和声明

ICS’18：2018年超级计算国际会议记录2018年6月第385-395页https://doi.org/10.1145/3205289.3205321

出版：2018年6月12日出版历史

ICS’18：2018年超级计算国际会议记录

第385-395页

摘要

调整参数以优化性能或其他感兴趣的指标（如能量、可变性等）的任务可能会耗费大量资源和时间。大参数空间的存在使得全面勘探不可行。在本文中，我们提出了一种新的引导方案，称为GEIST，用于参数空间探索，以快速找到性能优化配置。我们的方案将参数空间表示为一个图，其连通性引导信息从已知配置传播。在半监督学习方法对参数图的预测指导下，GEIST能够使用有限的实验结果自适应采样并找到所需的配置。我们展示了GEIST在为几个并行代码（包括LULESH、Kripke、Hypre和OpenAtom）选择应用程序输入选项、编译器标志和运行时/系统设置方面的有效性。

工具书类

Bilge Acun、Abhishek Gupta、Nikhil Jain、Akhil Langer、Harshitha Menon、Eric Mikida、Xiang Ni、Michael Robson、Yanhua Sun、Ehsan Totoni、Lukasz Wesolowski和Laxmikant Kale。2014.具有可移植对象的并行编程：Charm++在实践中的应用（SC）。谷歌学者数字图书馆
Prasanna Balaprakash、Robert B Gramacy和Stefan M Wild。2013.基于主动学习的代理模型，用于实证性能调整。集群计算（Cluster），2013年IEEE国际会议，IEEE，1-8。谷歌学者交叉引用
David Beckingsale、Olga Pearce、Ignacio Laguna和Todd Gamblin。2017年，阿波罗：可重用模型，用于快速动态调整输入相关代码。在2017 IEEE国际并行和分布式处理研讨会（IPDPS）上。电气与电子工程师协会。谷歌学者交叉引用
Z.Bei、Z.Yu、H.Zhang、W.Xiong、C.Xu、L.Eeckhout和S.Feng。2016.RFHOC：自动调整Hadoop配置的随机森林方法。IEEE并行和分布式系统汇刊27，5（2016年5月），1470--1483。谷歌学者数字图书馆
奥利维尔·夏贝尔、伯恩哈德·肖尔科夫和亚历山大·齐恩。2009.半监督学习（chapelle，o.等人，eds.；2006）{书评}。IEEE神经网络汇刊20，3（2009），542--542。谷歌学者数字图书馆
Ray S Chen和Jeffrey K Hollingsworth。2015.Angel:多目标在线自动调整的分层方法。第五届超级计算机运行时和操作系统国际研讨会论文集。美国医学会，4。谷歌学者数字图书馆
杨晨、黄元杰、列文·埃克霍特、格里戈里·福辛、梁鹏、奥利维尔·特曼和吴成勇。2010.评估1000个数据集的迭代优化。第31届ACM SIGPLAN编程语言设计与实现会议记录（PLDI’10）。ACM，美国纽约州纽约市，448-459。谷歌学者数字图书馆
I-H Chung和Jeffrey K Hollingsworth。2006年，大型科学项目使用自动性能调整的案例研究。《高性能分布式计算》，2006年第15届IEEE国际研讨会，IEEE，45-56。谷歌学者交叉引用
克里斯蒂安·鲁普什（CristianŢŤrpuš）、I-Xin Chung和杰弗里·霍林斯沃思（Jeffrey K.Hollingsworth）。2002.主动和声：走向自动性能调节。2002年ACM/IEEE超级计算会议记录（SC'02）。IEEE计算机学会出版社。谷歌学者数字图书馆
Dmitry Duplyakin、Jed Brown和Robert Ricci。2016.绩效分析中的主动学习。集群计算（Cluster），2016年IEEE国际会议，IEEE，182-191。谷歌学者交叉引用
托马斯·L·福尔奇和安妮·C·埃尔斯特。2017.基于机器学习的自动调谐，增强OpenCL应用程序的性能可移植性。并发与计算：实践与经验29，8（2017）。谷歌学者
R.D.Falgout、J.E.Jones和U.M.Yang。2006.并行高性能预处理器库hypre的设计与实现。在并行计算机上求解偏微分方程的数值方法中，A.M.Bruaset和A.Tveito（Eds.）。第51卷。斯普林格·弗拉格，267-294。谷歌学者
Archana Ganapathi、Kaushik Datta、Armando Fox和David Patterson。2009年，机器学习优化多核性能案例。在第一届USENIX并行热点会议的会议记录中。USENIX协会。谷歌学者数字图书馆
迈克尔·格恩特和迈克尔·奥特。2010年，潜望镜自动性能分析。并发和计算：实践和经验22，6（2010）。谷歌学者数字图书馆
亚历山大·格雷巴恩（Alexander Grebhahn）、诺伯特·西格蒙德（Norbert Siegmund）、哈拉尔德·科斯特勒（Harald Köstler）和斯文·阿佩尔（Sven Apel）。2016年，多网格求解器配置的性能预测。在Exascale Computing软件中。施普林格，69-88。谷歌学者
Philipp Gschwandtner、Juan JoséDurillo和Thomas Fahringer。2014年，《内部多目标自动调整：时间、能源和资源使用的优化和权衡分析》。。以EuroPar为单位。87--98.谷歌学者
R D Hornung和J A Keasler。2014年，RAJA可渗透性层：概述和状态。技术报告LLNL-TR-661403。劳伦斯·利弗莫尔国家实验室。谷歌学者
Nikhil Jain、Eric Bohm、Eric Mikida、Subhasish Mandal、Minjung Kim、Pratek Jindal、Qi Li、Sohrab Ismail-Beigi、Glenn Martyna和Laxmikant Kale。2016。OpenAtom：具有多种功能的可扩展Ab Initio分子动力学。在国际超级计算会议（ISC HPC’16）上。谷歌学者
Pooyan Jamshidi、Norbert Siegmund、Miguel Velez、Christian Kästner、Akshay Patel和Yuvraj Agarwal。2017.可配置系统性能建模的转移学习：探索性分析。《第32届IEEE/ACM自动化软件工程国际会议论文集》，IEEE出版社，497-508。谷歌学者数字图书馆
托尔斯滕·约阿希姆斯（Thorsten Joachims）。2003.通过谱图分割进行的传递性学习。第20届国际机器学习会议（ICML-03）论文集。谷歌学者数字图书馆
AJ Kunen、TS Bailey和PN Brown。2015年，克里普克——大规模并行运输小型应用。Lawrence Livermore国家实验室（LLNL），加利福尼亚州利弗莫尔，技术代表（2015）。谷歌学者
Ashraf Mahgoub、Paul Wood、Sachandhan Ganesh、Subrata Mitra、Wolfgang Gerlach、Travis Harrison、Folker Meyer、Ananth Grama、Saurabh Bagchi和索马里Chaterji。2017.Rafiki：用于动态宏基因组学工作负载的NoSQL数据存储参数调整的中间件。第18届ACM/IFIP/USENIX中间件会议记录（中间件’17）。ACM，美国纽约州纽约市，28-40。谷歌学者数字图书馆
阿尼鲁达·马拉特（Aniruddha Marathe）、拉西尔·阿尼鲁德（Rushil Anirudh）、尼基尔·贾恩（Nikhil Jain）、阿比纳夫·巴特勒（Abhinav Bhatele）、贾亚曼·蒂亚加拉扬（Jayaraman Thiagarajan）、巴维亚·凯尔库拉（Bhavya Kailkhura）、杰·升阳（Jae-Se。2017.使用深度迁移学习进行资源约束下的绩效建模。《ACM/IEEE高性能计算、网络、存储和分析国际会议论文集》（SC'17）。IEEE计算机学会。LLNL-CONF-736726。谷歌学者数字图书馆
索拉夫·穆拉利德兰（Saurav Muralidharan）、马努·桑塔拉姆（Manu Shantharam）、玛丽·霍尔（Mary Hall）、迈克尔·加兰德（Michael Garland）和布莱恩·卡坦扎罗（Bryan Catanzaro）。2014.Nitro：自适应代码变量调整框架。在2014年IEEE第28届国际并行和分布式处理研讨会上。电气与电子工程师协会。谷歌学者数字图书馆
William F Ogilvie、Pavlos Petoumenos、Zheng Wang和Hugh Leather。2017年，通过主动学习将迭代编译的成本降至最低。2017年代码生成与优化国际研讨会论文集。IEEE出版社，245--256。谷歌学者数字图书馆
Amit Roy、Prasanna Balaprakash、Paul D Hovland和Stefan M Wild。2016.利用搜索算法的性能可移植性进行自动调整。在并行和分布式处理研讨会研讨会上，2016 IEEE国际。电气与电子工程师协会。谷歌学者交叉引用
毛刺消失。2012.主动学习。人工智能与机器学习综合讲座6，1（2012），1-114。谷歌学者数字图书馆
安娜塔·蒂瓦里（Ananta Tiwari）、陈淳（Chun Chen）、杰奎琳·查姆（Jacqueline Chame）、玛丽·霍尔（Mary Hall）和杰弗里·霍林斯沃思（Jeffrey K Hollingsworth）。2009年。用于编译器优化的可扩展自动调优框架。《并行与分布式处理》，2009年。IPDPS 2009。IEEE国际研讨会，IEEE，1-12。谷歌学者数字图书馆
安娜塔·蒂瓦里（Ananta Tiwari）和杰弗里·霍林斯沃思（Jeffrey K Hollingsworth）。2011.在线自适应代码生成和调优。在并行与分布式处理研讨会（IPDPS）上，2011 IEEE国际。IEEE，879--892。谷歌学者数字图书馆
山口裕（Yuto Yamaguchi）、法洛索斯（Christos Faloutsos）和北川博彦（Hiroyuki Kitagawa）。2016年，Camlp:Confidence-aware调制标签传播。2016年SIAM数据挖掘国际会议论文集。暹罗，513--521。谷歌学者交叉引用
张华哲和亨利·霍夫曼。2016.在功率上限下实现性能最大化：硬件、软件和混合技术的比较。SIGPLAN不是。51, 4 (2016), 545--559.谷歌学者数字图书馆

索引术语

快速调谐的自举参数空间探索

建议

最小化Xeon Phi内核使用，执行时间影响可忽略
XSEDE16:XSEDE16多样性、大数据和大规模科学会议记录

多年来，GPU一直是HPC群集（Titan和Piz Daint）的组件，而Intel®Xeon Phi™仅在最近几年才被包括在内（天河2号和Stampede）。例如，GPU位于2015年11月Top500列表中14%的系统中，而。。。
阅读更多信息
当参数调整实际上是参数控制时
GECCO’11：第13届遗传和进化计算年会会议记录

在本文中，我们证明了序列参数优化（SPO），一种设计用于（离线）参数调整的方法，可以成功地用作进化算法（EA）的多阶段方法的控制器。我们通过……来证明这一点。。。
阅读更多信息
仿射程序混合精度代码自动生成和调整的整体方法
PPoPP’24：第29届ACM SIGPLAN并行编程原理与实践年度研讨会会议记录

降低浮点（FP）精度用于权衡数值程序输出的质量下降对性能的影响，但这种优化与类型转换相一致，在混合精度代码版本发布之前，其开销是不公开的。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于

ICS’18：2018年超级计算国际会议记录
2018年6月
407页
国际标准图书编号：9781450357838
内政部：10.1145/3205289

版权所有©2018 ACM
©2018计算机协会。ACM承认，该贡献是由美国政府的雇员、承包商或附属机构撰写或共同撰写的。因此，美国政府保留非排他性、免版税的权利，仅为政府目的出版或复制本文章，或允许他人这样做。
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2018年6月12日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
自整定
性能
取样
半监督学习
限定符
- 研究论文
- 研究
- 推荐有限公司
会议

接受率
总体验收率629属于2,180提交文件，29%
资金来源
其他指标
查看文章指标

文章度量标准
- 17
  引文总数
  查看引文
- 454
  总下载次数
- 下载次数（过去12个月）91
- 下载次数（最近6周）6
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

快速调谐的自举参数空间探索

ICS’18：2018年超级计算国际会议记录

摘要

工具书类

引用人

索引术语

建议

最小化Xeon Phi内核使用，执行时间影响可忽略

当参数调整实际上是参数控制时

仿射程序混合精度代码自动生成和调整的整体方法

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

资金来源

其他指标

文章度量标准

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

快速调谐的自举参数空间探索

ICS’18：2018年超级计算国际会议记录

摘要

工具书类

引用人

索引术语

建议

最小化Xeon Phi内核使用，执行时间影响可忽略

当参数调整实际上是参数控制时

仿射程序混合精度代码自动生成和调整的整体方法

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

资金来源

文章度量标准

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享