跳到主要内容
10.5555/1413370.1413375acm会议文章/章节视图摘要出版物页面供应链会议记录会议集合
研究论文

最新多核结构上的模板计算优化和自动调整

SC'08:2008 ACM/IEEE超级计算会议记录条款编号:4第1-12页
出版:2008年11月15日出版历史

摘要

理解新兴多核系统的最有效设计和利用是几十年来主流和科学计算行业面临的最具挑战性的问题之一。我们的工作探索了多核模板(最近邻)计算——这是许多结构化网格代码(包括PDF解算器)核心的一类算法。我们开发了许多有效的优化策略,并构建了一个自动调整环境,搜索我们的优化及其参数,以最小化运行时,同时最大限度地提高性能可移植性。为了评估这些策略的有效性,我们探索了当前HPC文献中最广泛的一组多核架构,包括Intel Clovertown、AMD Barcelona、Sun Victoria Falls、IBM QS22 PowerXCell 8i和NVIDIA GTX280。总的来说,我们的自动调整优化方法产生了迄今为止最快的多核模具性能。最后,我们对新兴多核设计的架构权衡及其对科学算法开发的影响提出了几个关键见解。

参考文献

  1. K.Asanovic、R.Bodik、B.Catanzaro等人。,“并行计算研究的前景:伯克利的观点”,EECS,加州大学伯克利分校,理工学院,众议员UCB/EECS-2006-1832006。谷歌学者谷歌学者
  2. M.Berger和J.Oliger,“双曲型偏微分方程的自适应网格细化”计算物理杂志第53卷,第484-512页,1984年。谷歌学者谷歌学者
  3. S.Sellappa和S.Chatterjee,“高效缓存多重网格算法”国际高性能计算应用杂志,第18卷,第1期,第115-133页,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  4. G.Rivera和C.Tseng,“3D科学计算的平铺优化”,inSC'00会议记录德克萨斯州达拉斯:超级计算2000,2000年11月。谷歌学者谷歌学者数字图书馆数字图书馆
  5. A.Lim、S.Liao和M.Lam,“使用仿射分区跨任意嵌套循环进行阻塞和数组收缩”,inACM SIGPLAN并行编程原理与实践研讨会论文集2001年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  6. S.Kamil、K.Datta、S.Williams、L.Oliker、J.Shalf和K.Yelick,《模具计算的隐式和显式优化》ACM SIGPLAN车间内存系统性能和正确性加利福尼亚州圣何塞,2006年。谷歌学者谷歌学者数字图书馆数字图书馆
  7. S.Williams、J.Carter、L.Oliker、J.Shalf和K.Yelick,《领先多核平台上的Lattice Boltzmann模拟优化》并行和分布式计算系统国际会议(IPDPS)2008年,佛罗里达州迈阿密。谷歌学者谷歌学者
  8. S.Williams、J.Shalf、L.Oliker、S.Kamil、P.Husbands和K.Yelick,《细胞处理器在科学计算方面的潜力》第三届计算机前沿会议记录,美国纽约州纽约市,2006年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. M.Gschwind,“芯片多处理和蜂窝宽带引擎”,inCF'06:第三届计算机前沿会议记录,纽约州纽约市,2006年,第1-8页。谷歌学者谷歌学者数字图书馆数字图书馆
  10. NVIDIA CUDA编程指南1.12007年11月。{在线}。可用:http://www.nvidia.com/object/cuda_develop.html(网址:http://www.nvidia.com/object/cuda_develop.html)谷歌学者谷歌学者
  11. R.C.Whaley、A.Petitet和J.Dongarra,“软件和ATLAS项目的自动经验优化”并行计算,第27卷(1-2),第3-35页,2001年。谷歌学者谷歌学者
  12. R.Vuduc、J.Demmel和K.Yelick,“OSKI:自动调谐稀疏矩阵内核库”,in程序。2005年SciDAC,物理学杂志:会议系列《物理研究所出版》,2005年6月。谷歌学者谷歌学者
  13. S.Kamil、P.Husbands、L.Oliker、J.Shalf和K.Yelick,“现代内存子系统对模板计算缓存优化的影响”,in第三届ACM SIGPLAN内存系统性能年度研讨会伊利诺伊州芝加哥,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. J.D.McCalpin,“STREAM:高性能计算机中的可持续内存带宽”http://www.cs.virginia.edu/stream/。谷歌学者谷歌学者
  15. S.Williams、L.Oliker、R.Vuduc、J.Shalf、K.Yelick和J.Demmel,“新兴多核平台上稀疏矩阵向量乘法的优化”程序。SC2007:高性能计算、网络和存储会议, 2007.谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 最新多核结构上的模板计算优化和自动调整

              建议

              评论

              登录选项

              检查您是否可以通过登录凭据或您的机构访问本文。

              登录

              完全访问权限

              • 发布于

                封面图片ACM会议
                SC'08:2008 ACM/IEEE超级计算会议记录
                2008年11月
                739页
                国际标准图书编号:9781424428359

                出版商

                IEEE出版社

                出版历史

                • 出版:2008年11月15日

                检查更新

                限定符

                • 研究论文

                接受率

                SC'08年纸张接受率59属于277提交文件,21%总体验收率1,516属于6,373提交文件,24%

              PDF格式

              以PDF文件查看或下载。

              PDF格式

              电子阅读器

              使用eReader联机查看。

              电子阅读器