×

在GPU上高效实现多体反应键序(REBO)势。 (英语) Zbl 1349.82031号

小结:第二代反应键序(REBO)经验势通常用于对广泛的烃类材料进行精确建模。它还可扩展到其他原子类型和交互。REBO势假设了复杂的多体交互模型,这在SIMD或SIMT编程模型中难以有效表示。因此,尽管GPGPU具有重要意义,但还没有针对这一潜力开发出有效的GPGPU实施。在这里,我们详细描述了使用REBO势的分子动力学算法的高效GPGPU实现。所提出的算法利用了现代GPU的SIMT架构很少使用的特性来解决多体势计算中出现的难以同步的问题。为这个问题开发的技术也可以用于实现不同问题的有效解决方案。使用一系列模型系统评估了所提算法的性能。它与LAMMPS包中提供的高度优化的CPU实现(单核和OpenMP)进行了比较。这些实验表明,与高端16核Intel Xeon处理器相比,使用NVIDIA Tesla K80单处理器的力计算时间提高了6倍。

MSC公司:

82B80型 平衡统计力学中的数值方法(MSC2010)
82B10型 量子平衡统计力学(通用)
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾伦,M.P。;Tildesley,D.J.,《液体的计算机模拟》(1989),牛津大学出版社·Zbl 0703.68099号
[2] Rahman,A.,液态氩中原子运动的相关性,物理学。修订版,136,2A,第A405条pp.(1964)
[3] Verlet,L.,经典流体的计算机“实验”,I:Lennard-Jones分子的热力学性质,物理学。修订版,159、1、98(1967)
[4] 蔡德华。;Beckett,C.,冲击波在立方晶格中的传播,J.Geophys。决议,71,10,2601-2608(1966)
[5] 拉赫曼,A。;Stillinger,F.H.,液态水分子动力学研究,化学杂志。物理。,553336-3359(1971年)
[6] McCammon,J.A。;Gelin,B.R。;Karplus,M.,《折叠蛋白质动力学》,《自然》,267,5612,585-590(1977)
[7] 霍利安,B.L。;Straub,G.K.,《三维固体中冲击波的分子动力学:完美晶体中从非稳定波到稳定波的转变及其对朗基纳-胡戈尼奥条件的影响》,《物理学》。修订稿。,43, 21, 1598 (1979)
[8] Van Gunsteren,W。;Berendsen,H.,《计算机模拟作为追踪溶液和结晶状态下蛋白质构象差异的工具》,《分子生物学杂志》。,176,4559-564(1984年)
[9] 莱维特,M。;Sharon,R.,《溶液中蛋白质动力学的精确模拟》,Proc。国家。阿卡德。科学。美国,85,20,7557-7561(1988)
[10] 霍利安,B.L.,《通过分子动力学模拟冲击波变形》,《物理学》。修订版A,37、7、2562(1988年)
[11] Freddolino,P.L。;Arkhipov,A.S。;拉尔森,S.B。;麦克弗森。;Schulten,K.,完整卫星烟草花叶病毒的分子动力学模拟,结构,14,3,437-449(2006)
[12] 赵,G。;紫苏,J.R。;Yufenyuy,E.L。;X孟。;陈,B。;宁,J。;Ahn,J。;Gronenborn,A.M。;舒尔滕,K。;Aiken,C.,《通过低温电子显微镜和全原子分子动力学研究成熟HIV-1衣壳结构》,《自然》,497,7451,643-646(2013)
[13] 亚伯拉罕,F.F。;瓦尔库普,R。;高,H。;M.Duchaineau。;德拉鲁比亚,T.D。;Seager,M.,《使用多达10亿个原子和世界上最快的计算机模拟材料失效:脆性断裂》,Proc。国家。阿卡德。科学。美国,99,9,5777-5782(2002)
[14] Shekhar,A。;野村,K.-i。;Kalia,R.K。;Nakano,A。;Vashishta,P.,《水中二氧化硅表面上的纳米气泡坍塌:十亿原子反应分子动力学模拟》,Phys。修订稿。,111、18,第184503条pp.(2013)
[15] 斯通,J.E。;菲利普斯,J.C。;Freddolino,P.L.(弗雷德里克多利诺,P.L.)。;哈代,D.J。;Trabuco,L.G。;Schulten,K.,《使用图形处理器加速分子建模应用程序》,J.Compute。化学。,28, 16, 2618-2640 (2007)
[16] 刘伟。;施密特,B。;沃斯,G。;Müller-Wittig,W.,使用CUDA图形处理单元加速分子动力学模拟,计算。物理学。社区。,179, 9, 634-641 (2008)
[17] 弗里德里希,M.S。;伊士曼,P。;Vaidyanathan,V。;马萨诸塞州休斯顿。;罗格朗,S。;Beberg,A.L。;Ensign,D.L。;布伦斯,C.M。;Pande,V.S.,《在图形处理单元上加速分子动力学模拟》,J.Compute。化学。,30, 6, 864-872 (2009)
[18] 普龙克,S。;帕尔,S。;舒尔茨,R。;Larsson,P。;比耶尔克马尔,P。;阿波斯托洛夫,R。;衬衫,M.R。;J.C.史密斯。;Kasson,P.M。;van der Spoel,D.,GROMACS 4.5:一个高通量和高度并行的开放源代码分子模拟工具包,生物信息学,文章btt055 pp.(2013)
[19] Salomon-Ferrer,R。;凯斯,D.A。;Walker,R.C.,琥珀生物分子模拟软件包概述,WIREs Compute。分子科学。,3, 2, 198-210 (2013)
[20] 菲利普斯,J.C。;布劳恩(Braun,R.)。;Wang,W。;甘巴特,J。;Tajkhorshid,E。;维拉,E。;Chipot,C。;Skeel,R.D。;Kale,L。;Schulten,K.,NAMD的可伸缩分子动力学,计算机J。化学。,26, 16, 1781-1802 (2005)
[21] 布鲁克斯,B.R。;Bruccoleri,R.E。;奥拉夫森,B.D。;大卫·S。;Swaminathan,S。;Karplus,M.,CHARMM:高分子能量、最小化和动力学计算程序,J.Compute。化学。,4, 187-217 (1983)
[22] Plimpton,S.,短程分子动力学的快速并行算法,计算机J。物理。,117,1,1-19(1995年)·Zbl 0830.65120号
[23] 斯塔德勒,J。;米库拉,R。;Trebin,H.-R.,IMD:并行计算机上分子动力学研究的软件包,国际期刊Mod。物理学。C、 81131-1140(1997年)
[24] 哈维,M.J。;Giupponi,G。;Fabritis,G.D.,ACEMD:微秒级生物分子动力学加速,化学杂志。理论计算。,5, 6, 1632-1639 (2009)
[25] 戈茨,A.W。;威廉姆森,M.J。;徐,D。;普尔,D。;南卡罗来纳州勒格兰德。;Walker,R.C.,GPU上琥珀色的常规微秒分子动力学模拟,1:广义玻恩,J.Chem。理论计算。,8, 5, 1542-1555 (2012)
[26] Salomon-Ferrer,R。;戈茨,A.W。;普尔,D。;南卡罗来纳州勒格兰德。;Walker,R.C.,在GPU上用琥珀进行常规微秒分子动力学模拟,2:显式溶剂粒子网格ewald,J.Chem。理论计算。,9, 9, 3878-3888 (2013)
[27] 伊士曼,P。;弗里德里希斯,M.S。;乔德拉,J.D。;Radmer,R.J。;布伦斯,C.M。;Ku,J.P。;波尚,K.A。;莱恩,T.J。;王丽萍。;Shukla,D.,OpenMM 4:用于高性能分子模拟的可重用、可扩展、独立于硬件的库,J.Chem。理论计算。,9, 1, 461-469 (2012)
[28] 布朗,W.M。;王,P。;Plimpton,S.J。;Tharrington,A.N.,在混合型高性能计算机上实现分子动力学——短程力,计算。物理学。社区。,182, 4, 898-911 (2011) ·Zbl 1221.82008年
[29] 布朗,W.M。;科尔迈耶,A。;Plimpton,S.J。;Tharrington,A.N.,《在混合型高性能计算机上实现分子动力学——粒子-粒子-分子筛,计算》。物理学。社区。,183, 3, 449-459 (2012)
[30] Glaser,J。;Nguyen,T.D。;安德森,J.A。;Lui,P。;斯皮加,F。;Millan,J.A。;莫尔斯特区。;Glotzer,S.C.,GPU上通用分子动力学模拟的强缩放,计算。物理学。社区。,192, 97-107 (2015)
[31] Ohira,T。;Ukai,O。;Noda,M.,微晶硅薄膜生长的基本过程:分子动力学研究,表面科学。,458, 1, 216-228 (2000)
[32] Liew,K。;Wong,C。;何,X。;Tan,M。;Meguid,S.,单壁和多壁碳纳米管的纳米力学,物理学。B版,固态,69、11,第115429页(2004年)
[33] Yoon,T。;Lim,T。;最小温度。;洪,S。;Jakse,N。;Lai,S.,通过模拟退火方法在6H-碳化硅衬底上外延生长石墨烯,J.Chem。物理。,第139、20条,第204702页(2013年)
[34] Abell,G.C.,分子和金属键的经验化学赝势理论,物理学。B版,31684-6196(1985年)
[35] Tersoff,J.,共价体系结构和能量的新经验方法,物理学。B版,37、12、6991-7000(1988年)
[36] Brenner,D.W.,《碳氢化合物用于模拟金刚石薄膜化学气相沉积的经验潜力》,Phys。B版,42、15、9458-9471(1990)
[37] 布伦纳,D.W。;O.A.Shenderova。;哈里森·J·A。;Stuart,S.J。;Ni,B。;Sinnott,S.B.,碳氢化合物的第二代反应经验键序(REBO)势能表达式,J.Phys。康登斯。Matter,14,4,783-802(2002)
[38] 凯拉萨,S.B。;Aktulga,H.M。;Grama,A.Y.,PuReMD-GPU:GPU的反应分子动力学模拟包,J.Compute。物理。,272, 343-359 (2014) ·Zbl 1349.82002号
[39] 郑,M。;李,X。;郭,L.,GPU-enabled reactive force field(ReaxFF)分子动力学算法,J.Mol.Graph。型号。,41, 0, 1-11 (2013)
[40] Keating,P.N.,不变性要求对晶体弹性应变能的影响及其在金刚石结构中的应用,Phys。修订版,145、2、637-645(1966年)
[41] Stillinger,F.H。;韦伯,T.A.,硅凝聚相局部有序的计算机模拟,物理。B版,31、8、5262-5271(1985)
[42] Stuart,S.J。;Tutein,A.B。;Harrison,J.A.,《分子间相互作用碳氢化合物的反应势》,J.Chem。物理。,112, 14, 6472-6486 (2000)
[43] 夏尔,J.D。;高,G。;Harrison,J.A.,利用第二代反应经验键序势Phys的参数化,计算硅材料的弹性常数作为温度的函数。B版,77,11,第115209条pp.(2008)
[44] 夏尔,J.D。;Harrison,J.A.,含硅、碳和氢材料的反应键序势,J.Phys。化学。C、 117、3、1323-1334(2013)
[45] 镍,硼。;Lee,K.-H。;Sinnott,S.B.,《碳氢-氧相互作用的反应经验键序(REBO)势》,J.Phys。康登斯。Matter,16,41,7261-7275(2004)
[47] 达古姆。;Enon,R.,OpenMP:用于共享内存编程的行业标准API,IEEE Compute。科学。工程师,5,1,46-55(1998)
[48] Hoshino,T。;Maruyama,N。;松冈,S。;Takaki,R.,CUDA vs OpenACC:使用内核基准和内存绑定CFD应用程序的性能案例研究,(第13届IEEE/ACM集群、云和网格计算国际研讨会。第13届EEE/ACM集群、云与网格计算国际会议,CCGrid 2013(2013),IEEE),136-143
[49] 诺曼,M。;Larkin,J。;沃斯,A。;Evans,K.,CUDA FORTRAN和OpenACC对大气气候内核的案例研究,J.Comput。科学。,2015年9月1-6日
[50] Rueda,A.J。;Noguera,J.M。;Luque,A.,《原生GPU计算与OpenACC在水文应用中实现流程算法的比较》,计算。地质科学。,87, 91-100 (2016)
[51] Lindholm,E。;Nickolls,J。;Oberman,S。;Montrym,J.,《NVIDIA Tesla:统一图形和计算架构》,IEEE MICRO,239-55(2008)
[52] Nickolls,J。;巴克,I。;加兰,M。;Skadron,K.,《使用CUDA的可扩展并行编程》,ACM Queue,6,2,40-53(2008)
[53] 斯通,J.E。;哈代,D.J。;Ufimtsev,I.S。;Schulten,K.,GPU加速分子建模成熟,J.摩尔图。型号。,29, 2, 116-125 (2010)
[54] NVIDIA,NVIDIAs下一代CUDA计算体系结构:开普勒GK110(2012),技术代表,NVIDI A白皮书
[55] Stuart,S.J。;李毅。;O.Kum。;Mintmire,J。;Voter,A.F.,使用空间和时间并行方法进行反应键序模拟,Struct。化学。,15, 5, 479-486 (2004)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。