摘要
Bilge Acun、Abhishek Gupta、Nikhil Jain、Akhil Langer、Harshitha Menon、Eric Mikida、Xiang Ni、Michael Robson、Yanhua Sun、Ehsan Totoni、Lukasz Wesolowski和Laxmikant Kale。 2014.具有可移植对象的并行编程:Charm++在实践中的应用(SC)。 谷歌学者 数字图书馆 Prasanna Balaprakash、Robert B Gramacy和Stefan M Wild。 2013.基于主动学习的代理模型,用于实证性能调整。 集群计算(Cluster),2013年IEEE国际会议,IEEE,1-8。 谷歌学者 交叉引用 David Beckingsale、Olga Pearce、Ignacio Laguna和Todd Gamblin。 2017年,阿波罗:可重用模型,用于快速动态调整输入相关代码。 在2017 IEEE国际并行和分布式处理研讨会(IPDPS)上。 电气与电子工程师协会。 谷歌学者 交叉引用 Z.Bei、Z.Yu、H.Zhang、W.Xiong、C.Xu、L.Eeckhout和S.Feng。 2016.RFHOC:自动调整Hadoop配置的随机森林方法。 IEEE并行和分布式系统汇刊27,5(2016年5月),1470--1483。 谷歌学者 数字图书馆 奥利维尔·夏贝尔、伯恩哈德·肖尔科夫和亚历山大·齐恩。 2009.半监督学习(chapelle,o.等人,eds.;2006){书评}。 IEEE神经网络汇刊20,3(2009),542--542。 谷歌学者 数字图书馆 Ray S Chen和Jeffrey K Hollingsworth。 2015.Angel:多目标在线自动调整的分层方法。 第五届超级计算机运行时和操作系统国际研讨会论文集。 美国医学会,4。 谷歌学者 数字图书馆 杨晨、黄元杰、列文·埃克霍特、格里戈里·福辛、梁鹏、奥利维尔·特曼和吴成勇。 2010.评估1000个数据集的迭代优化。 第31届ACM SIGPLAN编程语言设计与实现会议记录(PLDI’10)。 ACM,美国纽约州纽约市,448-459。 谷歌学者 数字图书馆 I-H Chung和Jeffrey K Hollingsworth。 2006年,大型科学项目使用自动性能调整的案例研究。 《高性能分布式计算》,2006年第15届IEEE国际研讨会,IEEE,45-56。 谷歌学者 交叉引用 克里斯蒂安·鲁普什(CristianŢŤrpuš)、I-Xin Chung和杰弗里·霍林斯沃思(Jeffrey K.Hollingsworth)。 2002.主动和声:走向自动性能调节。 2002年ACM/IEEE超级计算会议记录(SC'02)。 IEEE计算机学会出版社。 谷歌学者 数字图书馆 Dmitry Duplyakin、Jed Brown和Robert Ricci。 2016.绩效分析中的主动学习。 集群计算(Cluster),2016年IEEE国际会议,IEEE,182-191。 谷歌学者 交叉引用 托马斯·L·福尔奇和安妮·C·埃尔斯特。 2017.基于机器学习的自动调谐,增强OpenCL应用程序的性能可移植性。 并发与计算:实践与经验29,8(2017)。 谷歌学者 R.D.Falgout、J.E.Jones和U.M.Yang。 2006.并行高性能预处理器库hypre的设计与实现。 在并行计算机上求解偏微分方程的数值方法中,A.M.Bruaset和A.Tveito(Eds.)。 第51卷。 斯普林格·弗拉格,267-294。 谷歌学者 Archana Ganapathi、Kaushik Datta、Armando Fox和David Patterson。 2009年,机器学习优化多核性能案例。 在第一届USENIX并行热点会议的会议记录中。 USENIX协会。 谷歌学者 数字图书馆 迈克尔·格恩特和迈克尔·奥特。 2010年,潜望镜自动性能分析。 并发和计算:实践和经验22,6(2010)。 谷歌学者 数字图书馆 亚历山大·格雷巴恩(Alexander Grebhahn)、诺伯特·西格蒙德(Norbert Siegmund)、哈拉尔德·科斯特勒(Harald Köstler)和斯文·阿佩尔(Sven Apel)。 2016年,多网格求解器配置的性能预测。 在Exascale Computing软件中。 施普林格,69-88。 谷歌学者 Philipp Gschwandtner、Juan JoséDurillo和Thomas Fahringer。 2014年,《内部多目标自动调整:时间、能源和资源使用的优化和权衡分析》。。 以EuroPar为单位。 87--98. 谷歌学者 R D Hornung和J A Keasler。 2014年,RAJA可渗透性层:概述和状态。 技术报告LLNL-TR-661403。 劳伦斯·利弗莫尔国家实验室。 谷歌学者 Nikhil Jain、Eric Bohm、Eric Mikida、Subhasish Mandal、Minjung Kim、Pratek Jindal、Qi Li、Sohrab Ismail-Beigi、Glenn Martyna和Laxmikant Kale。 2016。OpenAtom:具有多种功能的可扩展Ab Initio分子动力学。 在国际超级计算会议(ISC HPC’16)上。 谷歌学者 Pooyan Jamshidi、Norbert Siegmund、Miguel Velez、Christian Kästner、Akshay Patel和Yuvraj Agarwal。 2017.可配置系统性能建模的转移学习:探索性分析。 《第32届IEEE/ACM自动化软件工程国际会议论文集》,IEEE出版社,497-508。 谷歌学者 数字图书馆 托尔斯滕·约阿希姆斯(Thorsten Joachims)。 2003.通过谱图分割进行的传递性学习。 第20届国际机器学习会议(ICML-03)论文集。 谷歌学者 数字图书馆 AJ Kunen、TS Bailey和PN Brown。 2015年,克里普克——大规模并行运输小型应用。 Lawrence Livermore国家实验室(LLNL),加利福尼亚州利弗莫尔,技术代表(2015)。 谷歌学者 Ashraf Mahgoub、Paul Wood、Sachandhan Ganesh、Subrata Mitra、Wolfgang Gerlach、Travis Harrison、Folker Meyer、Ananth Grama、Saurabh Bagchi和索马里Chaterji。 2017.Rafiki:用于动态宏基因组学工作负载的NoSQL数据存储参数调整的中间件。 第18届ACM/IFIP/USENIX中间件会议记录(中间件’17)。 ACM,美国纽约州纽约市,28-40。 谷歌学者 数字图书馆 阿尼鲁达·马拉特(Aniruddha Marathe)、拉西尔·阿尼鲁德(Rushil Anirudh)、尼基尔·贾恩(Nikhil Jain)、阿比纳夫·巴特勒(Abhinav Bhatele)、贾亚曼·蒂亚加拉扬(Jayaraman Thiagarajan)、巴维亚·凯尔库拉(Bhavya Kailkhura)、杰·升阳(Jae-Se。 2017.使用深度迁移学习进行资源约束下的绩效建模。 《ACM/IEEE高性能计算、网络、存储和分析国际会议论文集》(SC'17)。 IEEE计算机学会。 LLNL-CONF-736726。 谷歌学者 数字图书馆 索拉夫·穆拉利德兰(Saurav Muralidharan)、马努·桑塔拉姆(Manu Shantharam)、玛丽·霍尔(Mary Hall)、迈克尔·加兰德(Michael Garland)和布莱恩·卡坦扎罗(Bryan Catanzaro)。 2014.Nitro:自适应代码变量调整框架。 在2014年IEEE第28届国际并行和分布式处理研讨会上。 电气与电子工程师协会。 谷歌学者 数字图书馆 William F Ogilvie、Pavlos Petoumenos、Zheng Wang和Hugh Leather。 2017年,通过主动学习将迭代编译的成本降至最低。 2017年代码生成与优化国际研讨会论文集。 IEEE出版社,245--256。 谷歌学者 数字图书馆 Amit Roy、Prasanna Balaprakash、Paul D Hovland和Stefan M Wild。 2016.利用搜索算法的性能可移植性进行自动调整。 在并行和分布式处理研讨会研讨会上,2016 IEEE国际。 电气与电子工程师协会。 谷歌学者 交叉引用 毛刺消失。 2012.主动学习。 人工智能与机器学习综合讲座6,1(2012),1-114。 谷歌学者 数字图书馆 安娜塔·蒂瓦里(Ananta Tiwari)、陈淳(Chun Chen)、杰奎琳·查姆(Jacqueline Chame)、玛丽·霍尔(Mary Hall)和杰弗里·霍林斯沃思(Jeffrey K Hollingsworth)。 2009年。用于编译器优化的可扩展自动调优框架。 《并行与分布式处理》,2009年。 IPDPS 2009。 IEEE国际研讨会,IEEE,1-12。 谷歌学者 数字图书馆 安娜塔·蒂瓦里(Ananta Tiwari)和杰弗里·霍林斯沃思(Jeffrey K Hollingsworth)。 2011.在线自适应代码生成和调优。 在并行与分布式处理研讨会(IPDPS)上,2011 IEEE国际。 IEEE,879--892。 谷歌学者 数字图书馆 山口裕(Yuto Yamaguchi)、法洛索斯(Christos Faloutsos)和北川博彦(Hiroyuki Kitagawa)。 2016年,Camlp:Confidence-aware调制标签传播。 2016年SIAM数据挖掘国际会议论文集。 暹罗,513--521。 谷歌学者 交叉引用 张华哲和亨利·霍夫曼。 2016.在功率上限下实现性能最大化:硬件、软件和混合技术的比较。 SIGPLAN不是。 51, 4 (2016), 545--559. 谷歌学者 数字图书馆
建议
最小化Xeon Phi内核使用,执行时间影响可忽略 XSEDE16:XSEDE16多样性、大数据和大规模科学会议记录 多年来,GPU一直是HPC群集(Titan和Piz Daint)的组件,而Intel®Xeon Phi™仅在最近几年才被包括在内(天河2号和Stampede)。 例如,GPU位于2015年11月Top500列表中14%的系统中,而。。。 当参数调整实际上是参数控制时 GECCO’11:第13届遗传和进化计算年会会议记录 在本文中,我们证明了序列参数优化(SPO),一种设计用于(离线)参数调整的方法,可以成功地用作进化算法(EA)的多阶段方法的控制器。 我们通过……来证明这一点。。。 仿射程序混合精度代码自动生成和调整的整体方法 PPoPP’24:第29届ACM SIGPLAN并行编程原理与实践年度研讨会会议记录 降低浮点(FP)精度用于权衡数值程序输出的质量下降对性能的影响,但这种优化与类型转换相一致,在混合精度代码版本发布之前,其开销是不公开的。。。