×

在GPU上使用混合精度求解器求解晶格QCD方程组。 (英语) Zbl 1215.81124号

概述:现代图形硬件是为高度并行的数字任务而设计的,对于许多科学应用来说,它具有显著的成本和性能优势。其中一个应用是晶格量子色动力学(晶格QCD),其中主要的计算挑战是在SU(3)规范场的存在下有效地求解离散的Dirac方程。使用NVIDIA的CUDA平台,我们实现了一个Wilson-Dirac稀疏矩阵向量乘积,在NVIDIA的GeForce GTX 280 GPU上分别以高达40、135和212 Gflops的双精度、单精度和半精度执行。我们使用可靠的更新为Krylov解算器开发了一种新的混合精度方法,该方法允许完全双精度精度,而对大部分计算只使用单精度或半精度算法。由此产生的BiCGstab和CG解算器运行超过100 Gflop,就收敛之前的迭代而言,在混合精度方面,其性能优于通常的缺陷校正方法。

MSC公司:

81伏05 强相互作用,包括量子色动力学
81T25型 晶格上的量子场论
81T80型 模拟和数值建模(量子场论)(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 埃格里,G.I。;福多,Z。;霍尔布林,C。;卡茨,S.D。;诺格拉迪,D。;Szabo,K.K.,作为视频游戏的格子QCD,计算。物理学。Comm.,177,631(2007)
[2] NVIDIA公司,NVIDIA CUDA编程指南(2009)
[3] 巴罗斯,K。;巴比奇,R。;布鲁尔(R.Brower)。;克拉克,医学硕士。;Rebbi,C.,使用CUDA进行晶格爆破计算,LATTICE2008,PoS,045(2008)
[4] D.Göddeke,R.Strzodka,S.Turek,用GPU加速双精度FEM模拟,摘自:2005年ASIM会议记录-第18届模拟技术研讨会,2005年;D.Göddeke,R.Strzodka,S.Turek,用GPU加速双精度FEM模拟,摘自:2005年ASIM会议记录-第18届模拟技术研讨会,2005年
[5] Sleijpen,G.L.G。;van der Vorst,H.A.,混合Bi-CG方法中的可靠更新残差,计算,56,141-164(1996)·Zbl 0842.65018号
[6] A.Munshi等人,OpenCL规范1.0版,技术报告,Khronos OpenCL工作组,2009.04.022009;A.Munshi等人,OpenCL规范1.0版,技术报告,Khronos OpenCL工作组,2009.04.022009
[7] 德格兰德,T.A。;罗西,P.,计算。物理学。Comm.,60,211(1990)
[8] N.Bell,M.Garland,CUDA上的高效稀疏矩阵向量乘法,NVIDIA技术报告NVR-2008-004,2008;N.Bell,M.Garland,CUDA上的高效稀疏矩阵向量乘法,NVIDIA技术报告NVR-2008-004,2008
[10] De Forcrand,P。;Lellouch,D。;Roiesnel,C.,优化晶格QCD模拟程序,J.Compute。物理。,59, 324 (1985) ·Zbl 0591.65002号
[11] G.Ruetsch,P.Micikevicius,《优化CUDA中的矩阵转置》,NVIDIA技术报告,2009年;G.Ruetsch,P.Micikevicius,CUDA中的优化矩阵转置,NVIDIA技术报告,2009年
[12] Holmgren,D.,费米实验室状态(2009年)
[13] Kahan,W.,《关于减少截断误差的进一步评论》,ACM委员会,8,40(1965)
[14] M.Harris,优化CUDA中的并行还原,与CUDA工具包打包的演示文稿,NVIDIA Corporation,2007年;M.Harris,优化CUDA中的并行还原,与CUDA工具包打包的演示文稿,NVIDIA Corporation,2007年
[15] 马丁·R·S。;彼得斯,G。;Wilkinson,J.H.,手册系列线性代数:正定方程组解的迭代精化,Numer。数学。,8, 203-216 (1966) ·Zbl 0158.33804号
[16] R.Strzodka,D.Göddeke,用于低精度组件快速准确PDE求解器的FPGA流水线混合精度算法,收录于:IEEE现场可编程定制计算机器研讨会(FCCM 2006),2006年4月,第259-268页;R.Strzodka,D.Göddeke,FPGA上的流水线混合精度算法,用于从低精度组件快速准确的PDE求解器,收录于:IEEE现场可编程定制计算机器研讨会(FCCM 2006),2006年4月,第259-268页
[17] Bulava,J.M.,物理学。D版,79,034505(2009)
[19] 爱德华兹·R·G。;Joo,B.,晶格QCD的Chroma软件系统,Nucl。物理学。B程序。补遗,140,832(2005)
[23] Brannick,J。;R.C.Brower。;克拉克,医学硕士。;奥斯本,J.C。;Rebbi,C.,晶格QCD的自适应多重网格算法,Phys。修订稿。,100, 041601 (2008)
[24] 克拉克,医学硕士。;Brannick,J。;R.C.Brower。;麦考密克,S.F。;Manteuffel,T.A。;奥斯本,J.C。;Rebbi,C.,《临界减速的消除》,LATTICE2008,PoS,035(2008)
[25] Bunk,B。;Sommer,R.,SU(3)矩阵的八参数表示及其在模拟晶格QCD中的应用,计算。物理学。Comm.,40,229(1986)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。