×

HONEI:针对多处理器体系结构的数值计算库集合。 (英语) Zbl 1197.65007号

摘要:我们介绍了HONEI,这是一个开源的库集合,提供了面向硬件的数值计算方法。HONEI抽象了硬件,在HONEI之上编写的应用程序可以在CPU、GPU和Cell处理器等多种计算机体系结构上执行。我们通过两个测试应用,即泊松问题的有限元多重网格求解器和浅水波的稳健快速模拟,展示了我们方法的灵活性和性能。通过与HONEI的库链接,我们使用HONEI的SSE后端实现了比直接C++代码快两倍的速度,并在Cell和GPU上实现了额外3-4倍和4-16倍的速度。我们方法的第二个重要方面是,可以通过向HONEI库添加优化的应用程序特定操作来利用考虑中硬件的全部性能能力。HONEI为此类内核的开发和评估提供了所有必要的基础设施,大大简化了内核的开发。

MSC公司:

65-04 与数值分析有关的问题的软件、源代码等
65平方米 涉及偏微分方程初值和初边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65年xx月 数值算法的计算机方面
64岁以下 分布式系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Satish Balay、Kris Buschelman、William D.Gropp、Dinesh Kaushik、Matthew G.Knepley、Lois Curfman McInnes、Barry F.Smith、Hong Zhang、PETSc网页,http://www.mcs.anl.gov/petsc, 2001; Satish Balay、Kris Buschelman、William D.Gropp、Dinesh Kaushik、Matthew G.Knepley、Lois Curfman McInnes、Barry F.Smith、Hong Zhang、PETSc网页,http://www.mcs.anl.gov/petsc, 2001
[2] Christian Becker,Strategien und Methoden zur Ausnutzung der High-Performance Computing-Resourcen moderner Rechnerachitekturen für Finite Element Simulationen und Realisierung in FEAST(有限元分析与求解工具),博士论文,多特蒙德大学,2007年5月,http://www.logos-verlag.de/cgi-bin/buch?isbn=1637; Christian Becker,Strategien und Methoden zur Ausnutzung der High-Performance Computing-Resourcen moderner Rechnerachitekturen für Finite Element Simulationen und Realisierung in FEAST(有限元分析与求解工具),博士论文,多特蒙德大学,2007年5月,http://www.logos-verlag.de/cgi-bin/buch?isbn=1637
[3] 马库斯·布拉特;Peter Bastian,《关于有限元方法迭代求解器的通用并行化》,国际计算科学与工程杂志,4,1,56-69(2008)
[4] Alfredo Buttari、Jack J.Dongarra、Jakub Kurzak、PLASMA网页,http://icl.cs.utk.edu/plasma, 2009; Alfredo Buttari、Jack J.Dongarra、Jakub Kurzak、PLASMA网页,http://icl.cs.utk.edu/plasma,2009年
[5] 阿尔弗雷多·布塔里;杰克·东加拉。;雅库布·库扎克;朱利安·兰古;彼得·卢斯科(Piotr Luszczek);Tomov,Stanimire,《多核对数学软件的影响》,(《2006年PARA会议录》,《应用并行计算》,《科学计算的现状》,2006年PAAR会议录,《应用平行计算》,科学计算的发展状况,《计算机科学讲义》,第4699卷(2006),斯普林格),第1-10页
[6] Alfredo Buttari、Piotr Luszczek、Jakub Kurzak、Jack J.Dongarra、George Bosilca、SCOP3:《PlayStation 3科学计算粗略指南》,技术报告,田纳西大学诺克斯维尔创新计算实验室,2007年。UT-CS-07-595;Alfredo Buttari、Piotr Luszczek、Jakub Kurzak、Jack J.Dongarra、George Bosilca、SCOP3:《PlayStation 3科学计算粗略指南》,技术报告,田纳西大学诺克斯维尔创新计算实验室,2007年。UT-CS-07-595
[7] Phillip Colella、Thom H.Dunning Jr.、William D.Gropp、David E.Keyes,《基于科学的大规模模拟案例》,技术报告,美国能源部科学办公室,http://www.pnl.gov/scales2003年7月;Phillip Colella、Thom H.Dunning Jr.、William D.Gropp、David E.Keyes,《基于科学的大规模模拟案例》,技术报告,美国能源部科学办公室,网址:http://www.pnl.gov/scales,2003年7月
[8] 阿纳吉罗斯一世(Anargiros I.Delis)。;Katsaounis,Theodoros D.,应用松弛方法数值求解二维浅水方程,应用数学建模,29,8,754-783(2005)·Zbl 1067.76586号
[9] 克雷格·C·道格拉斯。;胡乔纳森;沃尔夫冈·卡尔(Karl,Wolfgang);科瓦希克,马库斯;乌尔里奇吕德;Weiß,Christian,《多重网格方法的固定和自适应缓存感知算法》,(Dick,Erik;Riemslagh,Kris;Vierendeels,Jan,multigrid methods VI,《计算科学与工程讲义》,第14卷(2000),Springer),87-93·Zbl 0972.65104号
[10] 克雷格·C·道格拉斯。;胡乔纳森;科瓦希克,马库斯;乌尔里奇吕德;Weiß,Christian,结构化和非结构化网格多重网格的缓存优化,数值分析电子交易,10,21-40(2000)·Zbl 0949.65099号
[11] 克雷格·C·道格拉斯。;Dan T.Thorne,《三维多重网格缓存存储方法注释》,《当代数学》,第306167-177页(2002年)·Zbl 1057.68131号
[12] Kayvon Fatahalian、Timothy J.Knight、Mike Houston、Mattan Erez、Daniel R.Horn、Larkhoon Leem、Ji Young Park、Manman Ren、Alex Aiken、William J.Dally、Pat Hanrahan、Sequoia:Programming the memory hierarchy,收录于:SC'06:2006年ACM/IEEE超级计算会议论文集,2006年11月;Kayvon Fatahalian、Timothy J.Knight、Mike Houston、Mattan Erez、Daniel R.Horn、Larkhoon Leem、Ji Young Park、Manman Ren、Alex Aiken、William J.Dally、Pat Hanrahan、Sequoia:Programming the memory hierarchy,in:SC'06:2006年ACM/IEEE超级计算会议论文集,2006年11月
[13] Dominik Göddeke,Robert Strzodka,面向硬件的本地、模拟和混合精度求解器在有限元模拟中的性能和准确性(第2部分:双精度GPU),技术报告,Fakultät für Mathematik,多特蒙德理工大学,2008年(NVISION 2008受邀演讲-视觉计算世界,编号370);Dominik Göddeke,Robert Strzodka,面向硬件的本地、模拟和混合精度求解器在有限元模拟中的性能和准确性(第2部分:双精度GPU),技术报告,Fakultät für Mathematik,多特蒙德理工大学,2008年(受邀在NVISION 2008上演讲-视觉计算世界,编号370)·Zbl 1188.68084号
[14] 多米尼克·Göddeke;罗伯特·斯特佐德卡(Robert Strzodka);Turek,Stefan,FEM仿真中面向硬件的本机、仿真和混合精度求解器的性能和准确性,并行、应急和分布式系统国际期刊,22,4,221-256(2007)·Zbl 1188.68084号
[15] Kazushige Goto、GotoBLAS、,http://www.tacc.utexas.edu/resources/software/#blas; Kazushige Goto、GotoBLAS、,http://www.tacc.utexas.edu/resources/software/#blas
[16] Peter Gottschling,David S.Wise,Michael D.Adams,具有可扩展性能的表示透明矩阵算法,载于:ICS’07:第21届超级计算国际年会论文集,2007年,第116-125页;Peter Gottschling、David S.Wise、Michael D.Adams,具有可扩展性能的表示透明矩阵算法,收录于:ICS’07:第21届国际超级计算年会论文集,2007年,第116-125页
[17] Michael A.Heroux。;罗斯科·A·巴特利特。;Howle,Vicki E。;罗伯特·霍克斯特拉(Robert J.Hoekstra)。;胡乔纳森·J。;塔马拉·科尔达(Tamara G.Kolda)。;理查德·莱霍克(Richard B.Lehoucq)。;Long,Kevin R。;罗杰·帕洛夫斯基(Roger P.Pawlowski)。;埃里克·T·菲普斯。;安德鲁·G·塞林格。;海蒂·K·桑奎斯特。;雷·S·图米纳罗(Ray S.Tuminaro)。;詹姆斯·M·威伦格林(James M.Willenbring)。;艾伦·威廉姆斯;Stanley,Kendall S.,Trilinos项目概述,ACM数学软件交易,31,3,397-423(2005)·兹比尔1136.65354
[18] IBM Corporation、SPE Runtime Management Library、,http://www-01.ibm.com/chips/techlib/techlab.nsf/pages/main, 2007; IBM Corporation、SPE Runtime Management Library、,http://www-01.ibm.com/chips/techlib/techlab.nsf/pages/main, 2007
[19] James A.Kahle。;戴,迈克尔·N。;Hofstee,H.Peter;查尔斯·约翰斯(Charles R.Johns)。;西奥多·R·马尤尔。;David Shippy,《Cell多处理器简介》,《IBM研究与开发杂志》,45,4/5,589-604(2005)
[20] Keyes,David E.,Terascale偏微分方程隐式方法,(Feng,Xiaobing;Schulze,Tim P.,《偏微分方程数值方法及其应用的最新进展》,《当代数学》,第306卷(2002年1月),美国数学学会),29-84·Zbl 1018.65121号
[21] Julie Langou、Julien Langou,Piotr Luszczek、Jakub Kurzak、Alfredo Buttari、Jack J.Dongarra,《性能工具和技术——利用32位浮点算法的性能获得64位精度(重新审视线性系统的迭代求精)》,in:SC'06:2006年ACM/IEEE超级计算会议记录,2006年,第113页;Julie Langou、Julien Langou,Piotr Luszczek、Jakub Kurzak、Alfredo Buttari、Jack J.Dongarra,《性能工具和技术——利用32位浮点算法的性能获得64位精度(重新审视线性系统的迭代求精)》,in:SC'06:2006年ACM/IEEE超级计算会议记录,2006年,第113页
[22] 埃里克·林德霍姆;约翰·尼克尔斯(John Nickolls);斯图亚特·奥伯曼;John Montrym,NVIDIA Tesla:统一图形和计算架构,IEEE Micro,28,2,39-55(2008)
[23] NVIDIA Corporation,NVIDIA-CUDA计算统一设备架构编程指南(2.0版),http://www.nvidia.com/cuda, 2008; NVIDIA Corporation,NVIDIA-CUDA计算统一设备架构编程指南(2.0版),http://www.nvidia.com/cuda, 2008
[24] 约翰·欧文斯(John D.Owens)。;Mike Houston;戴维·卢贝克(David Luebke);西蒙·格林;约翰·E·斯通(John E.Stone)。;Phillips,James C.,GPU计算,美国电气与电子工程师协会论文集,96,5,879-899(2008)
[25] 约翰·欧文斯。;戴维·卢贝克(David Luebke);戈文达拉朱,纳加;Mark Harris;Krüger,Jens;Lefohn,Aaron E。;Purcell,Timothy J.,《图形硬件通用计算调查》,计算机图形论坛,26,1,80-113(2007)
[26] Michael P.Perrone,Tanaz Sowadagar,Cell BE软件编程和工具包,收录于:SC'06:2006年ACM/IEEE超级计算会议记录,2006年;Michael P.Perrone,Tanaz Sowadagar,Cell BE软件编程和工具包,收录于:SC'06:2006年ACM/IEEE超级计算会议记录,2006年
[27] Dac C.Pham、Asano Shigehiro、Mark Bolliger、Michael N.Day、H.Peter Hofstee、Charles R.Johns、James A.Kahle、Atsushi Kameyama、John Keaty、Yoshio Masubuchi、Mack Riley、David Shippy、Daniel L.Stasiak、Masakazu Suzuoki、M.Wang、詹姆斯·沃诺克、Steve Weitzel、Dieter Wendel、Takeshi Yamazaki、Kazuaki Yazawa、,第一代CELL处理器的设计和实现,见:固态电路会议,ISSCC 2005,技术论文摘要,第1卷,2005年2月,第184-592页;Dac C.Pham、Asano Shigehiro、Mark Bolliger、Michael N.Day、H.Peter Hofstee、Charles R.Johns、James A.Kahle、Atsushi Kameyama、John Keaty、Yoshio Masubuchi、Mack Riley、David Shippy、Daniel L.Stasiak、Masakazu Suzuoki、M.Wang、詹姆斯·沃诺克、Steve Weitzel、Dieter Wendel、Takeshi Yamazaki、Kazuaki Yazawa、,第一代CELL处理器的设计和实现,见:固态电路会议,ISSCC 2005,技术论文摘要,第1卷,2005年2月,第184-592页
[28] 索尼公司、东芝公司、IBM公司、Cell BE处理器和刀片系统,http://www-03.ibm.com/technology/splash/qs20/, http://www.ibm.com/developerworks/power/cell; 索尼公司、东芝公司、IBM公司、Cell BE处理器和刀片系统,http://www-03.ibm.com/technology/splash/qs20/, http://www.ibm.com/developerworks/power/cell
[29] Stefan Turek;克里斯蒂安·贝克尔(Christian Becker);Kilian,Susanne,PDE软件的面向硬件的数字和概念,未来一代计算机系统,22,1-2,217-238(2004)
[30] Samuel Williams、John Shalf、Leonid Oliker、Shoaib Kamil、Parry Husbands、Katherine Yelick,《细胞处理器在科学计算中的潜力》,收录于:CF'06:ACM国际计算前沿会议论文集,2006年5月,第9-20页;Samuel Williams、John Shalf、Leonid Oliker、Shoaib Kamil、Parry Husbands、Katherine Yelick,《Cell处理器在科学计算中的潜力》,收录于:CF'06:ACM国际计算前沿会议论文集,2006年5月,第9-20页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。