×

用于在GPU和CPU上解含时薛定谔方程的OpenCL实现。 (英语) Zbl 1296.81009号

概要:开放计算语言(OpenCL)是一种并行处理语言,非常适合在图形处理单元(GPU)上运行并行算法。在本工作中,我们报告了基于OpenCL模型的一阶常微分方程组(ODE)数值求解通用并行单GPU代码的开发。我们将该代码应用于强激光场中氢原子的时间依赖薛定谔方程,并研究了其在NVIDIA和AMD GPU上的性能与CPU上的串行性能。我们发现GPU在CPU设备上具有出色的可扩展性和显著的加速能力。基准测试中的加速比趋向于约40,与多核CPU相比,预计会有显著的加速比。此外,虽然我们没有在这里提供详细的基准测试,但通过对描述的算法进行轻微优化,我们也实现了约75的加速值。

理学硕士:

81-04 量子理论相关问题的软件、源代码等
2005年第81季度 薛定谔、狄拉克、克莱恩·戈登和其他量子力学方程的封闭解和近似解
65日元10 特定类别建筑的数值算法
2011年第35季度 依赖时间的薛定谔方程和狄拉克方程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Kulander,K.C.,物理。版本A,36,2726(1987)
[2] Lambropoulos,P。;马拉加基斯,P。;Zhang,J.,物理学。代表,305203(1998)
[3] J.S.帕克。;摩尔,L.R。;邓达斯,D。;Taylor,K.T.和J.Phys。B、 33,L691-L698(2000)
[4] J.S.帕克。;Doherty,B.J.S。;Taylor,K.T。;舒尔茨,K.D。;C.I.布拉加。;DiMauro,L.F.,物理学。修订版Lett。,96133001(2006年)
[5] Krausz,F。;Ivanov,M.,数学评论。物理。,81, 163-234 (2009)
[6] 北卡罗来纳州贝拉。;Bozek,J。;科斯特洛,J.T。;杜斯特尔,S。;方,L。;Feldhaus,J。;福泽,H。;霍纳,M。;Jiang,Y.H。;Johnsson,P.和J.Mod。选择。,57, 1015 (2010)
[7] Kulander,K.,物理学。修订版A,38,778(1988)
[8] 克劳斯,J.L。;Schafer,K.J。;Kulander,K.C.,化学。物理学。莱特。,178573(1991年)
[9] Nguyen,N。;班德拉克,A.,Phys。修订版A,73,3,032708(2006)
[10] Caillat,J。;Zanghellini,J。;Kitzler,M。;科赫,O。;Kreuzer,W。;Scrinzi,A.,《物理学》。版本A,71,012712(2005)
[11] 伯克·P。;Franken,P。;Joachain,C.和J.Phys。B、 24751(1991)
[12] 范德哈特,H。;Lysaght,M。;P.伯克,物理学。版本A,76,043405(2007)
[13] 关,X。;诺布尔,C。;萨萨里尼,O。;Bartschat,K。;施耐德,B.,计算。物理学。Comm.,180,12,2401-2409(2009年)·Zbl 1197.81014号
[14] Nikolopoulos,L。;Parker,J。;Taylor,K.和Phys。版本A,78,063420(2008)
[15] Lysaght,M。;摩尔,L。;Nikolopoulos,L。;Parker,J。;哈特,H。;Taylor,K.(Andre D.Bandrauk;Misha Ivanov,量子动态成像。量子动态成像,数学物理CRM系列(2011),Springer:Springer New York),107-134
[16] 摩尔,L.R。;Lysaght,医学硕士。;尼科洛普洛斯,洛杉矶。;J.S.帕克。;范德哈特,H.W。;Taylor,K.T.,J.现代选择。,2011年11月13日,第58页,第1132-1140页
[17] Pennycook,S。;哈蒙德,S。;穆达利奇,G。;赖特,S。;Jarvis,S.,《计算》。J.,55,2,138-153(2011)
[18] 库达。网址:www.nvidia.com/cuda;库达。网址:www.nvidia.com/cuda
[19] 打开cl。网址:www.khronos.org/opencl;打开cl。网址:www.khronos.org/opencl·Zbl 1344.81145号
[20] PGI CUDA Fortran编译器。网址:http://www.pgroup.com/resources/cudafortran.htm; PGI CUDA Fortran编译器。网址:http://www.pgroup.com/resources/cudafortran.htm
[21] Fortrancl。网址:http://code.google.com/p/fortrancl/; Fortrancl。网址:http://code.google.com/p/fortrancl/
[22] 马尔克斯,M。;卡斯特罗,A。;Bertsch,G。;Rubio,A.,《计算》。物理学。Comm.,151,1,60-78(2003)
[23] 哈维,M。;Fabritis,G.D.,计算。物理学。Comm.,182,4,1093-1099(2011)
[24] Bauke,H。;Keitel,C.H.,计算。物理学。Comm.,182,12,2454-2463(2011)·Zbl 1261.65101号
[25] 斯通,J.E。;哈代,D.J。;Ufimtsev,I.S。;Schulten,K.,J.摩尔图。型号。,29, 2, 116-125 (2010)
[26] Ueda,R。;松本,Y。;Itagaki,M。;Oikawa,S.,Plasma Fusion Res,6,2401092(2011)
[27] Weigel,M.,《计算》。物理学。Comm.,182,9,1833-1836(2011),挪威特隆赫姆计算物理会议特别版
[28] Kreisbeck,C。;Kramer,T。;罗德格斯,M。;Hein,B.,J.化学。理论计算。,7, 2166-2174 (2011)
[29] ATI FirePro V7800专业图形。网址:http://www.amd.com网站; ATI FirePro V7800专业图形。网址:http://www.amd.com网站
[30] GDDR5内存描述。网址:网址:http://www.amd.com/us/products/technologies/gddr5; GDDR5内存描述。网址:http://www.amd.com/us/products/technologies/gddr5
[31] Khronos Group,《OpenCL规范》,原稿,2010年9月。网址:http://www.khronos.org/registry/cl/specs/opencl-1.1.pdf; Khronos Group,《OpenCL规范》,原稿,2010年9月。网址:http://www.khronos.org/registry/cl/specs/opencl-1.1.pdf
[32] 尼科洛普洛斯,洛杉矶,物理学。版本A,73,043408(2006)
[33] Sobel'man,I.,《原子光谱理论导论》(1972),佩加蒙出版社:牛津佩加蒙出版有限公司
[34] J·多曼德。;Prince,P.,J.计算。申请。数学。,6, 1, 19-26 (1980) ·Zbl 0448.65045号
[35] Parker,J。;克拉克,C.,J.Opt。Soc.Amer公司。B、 13、2、371-379(1996)
[36] AMD加速并行处理(OpenCL^®)http://developer.amd.com/sdks/amdappsdk; AMD加速并行处理(OpenCL^®)http://developer.amd.com/sdks/amdapsdk
[37] 史密斯,E.S。;J.S.帕克。;Taylor,K.,计算。物理学。通信,114,1-3,1-14(1998)·Zbl 1023.81524号
[38] NVIDIA技术代表。[链接]URL:http://www.nvidia.com/docs/IO/43395/SP-04154-001_v03.pdf; NVIDIA技术代表。[链接]URL:http://www.nvidia.com/docs/IO/43395/SP-04154-001_v03.pdf
[39] 特斯拉S1070数据表,NVIDIA,2008年6月。;特斯拉S1070数据表,NVIDIA,2008年6月。
[40] Intel Xeon处理器W3503(4M缓存,2.40 GHz,4.80 GT/s Intel QPI)。网址:http://ark.intel.com/products/40799; Intel Xeon处理器W3503(4M缓存,2.40 GHz,4.80 GT/s Intel QPI)。网址:http://ark.intel.com/products/40799
[41] 现金,J。;卡普,A.,ACM Trans。数学。软件,16,201-222(1990)·Zbl 0900.65234号
[42] 出版社,W.H。;Teukolsky,S.A。;韦特林,W.T。;Flannery,B.P.,《数值配方第三版:科学计算的艺术》(2007),剑桥大学出版社·Zbl 1132.65001号
[43] 阿舍尔,U.M。;Petzold,L.R.,常微分方程和微分代数方程的计算机方法(1998),SIAM·Zbl 0908.65055号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。