×

基于GPU和CUDA的大型液态金属原子体系加速凝固过程模拟。 (英语) Zbl 1349.82093号

摘要:分子动力学模拟是模拟和分析原子特性的复杂物理过程和现象的有力工具,用于预测原子系统的自然时间演化。物理过程的精确模拟对模拟规模和计算时间都有很强的要求。因此,找到可用的计算资源对加速计算至关重要。然而,由于浮点运算的高性能、宽内存带宽和增强的可编程性,最近大量计算资源(GPGPU)被用于通用计算。在研究液态金属凝固过程的情况下,对于MD模拟计算中最耗时的部分,本文提出了一种细粒度的空间分解方法,通过利用现代图形处理器(GPU),将仿真系统的规模扩大到一个包含10个单元的仿真系统,来加速邻域列表更新的计算和交互力的计算000000个原子。此外,还讨论了一些评估和测试,从在不同精度启用的CUDA版本上执行,到在不同类型的GPU(NVIDIA 480GTX、580GTX和M2050)上执行,再到具有不同数量CPU内核的CPU集群。实验结果表明,基于GPU的计算通常比相应的顺序执行快9倍,比16个CPU内核集群实现快约1.5倍。在模拟结果的基础上,将理论结果与实验结果进行了比较,观察到实际宏观材料中两种更完整、更大的团簇结构之间有很好的一致性。此外,在大型系统中观察到金属凝固过程中形成的纳米团簇和纳米晶体的不同成核和演化机制。

理学硕士:

82C80码 时间相关统计力学的数值方法(MSC2010)
82天35分 金属统计力学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alder,B.J。;Wainwright,T.E.,硬球系统的相变,J.Chem。物理。,1208-1209 (1957)
[2] 艾伦,M.P。;Tildesley,D.J.,《液体的计算机模拟》(1987),克拉伦登:克拉伦登牛津·Zbl 0703.68099号
[3] 安德森,J.A。;Lorenz,C.D。;Travesset,A.,在图形处理单元上完全实现的通用分子动力学模拟,J.Compute。物理。,第227页,第10页,5342-5539页(2008年)·Zbl 1148.81301号
[4] 弗里德里希斯,M.S。;伊士曼,P。;Vaidyanathan,V.,《在图形处理单元上加速分子动力学模拟》,J.Compute。化学。,30, 6, 864-872 (2009)
[5] 刘伟国;施密特,贝蒂尔;格瑞特·沃斯(Gerrit Voss);Wolfgang Muller-witting,使用CUDA图形处理单元加速分子动力学模拟,计算。物理学。社区。,179, 634-641 (2008)
[6] Preis,T。;维尔瑙,P。;Paul,W.,GPU加速了2D和3D Ising模型的Monte Carlo模拟,J.Compute。物理。,228, 12, 4468-4477 (2009) ·Zbl 1167.82347号
[7] Ren,N。;梁,J。;Qu,X.,基于GPU的光在复杂异质组织中传播的蒙特卡罗模拟,Opt。快递,18,7,6811-6823(2010)
[8] Komura,Y。;Okabe,Y.,基于GPU的Swendsen-Wang多簇算法,用于模拟二维经典自旋系统,计算。物理学。社区。,183, 6, 1155-1161 (2012)
[9] Liu,R.S.,《快淬金属结构因子的亚峰值》,Phys。版本B,45,1,451-453(1992)
[10] Liu,R.S.,一些快速淬火金属的结构因子异常,Phys。B版,46、18、12001-12003(1992)
[11] Liu,R.S.,液态金属快速凝固过程中形成的纳米团簇的形成和描述,《非晶体杂志》。固体,351,612-617(2005)
[12] Liu,R.S.,凝固过程中形成的团簇的形成和幻数特征,J.Phys。康登斯。Matter,19,196103(2007)
[13] Hou,Z.Y.,钠快速凝固结构中纳米团簇形成和演化特性的模拟研究,模型。模拟。马特。科学。工程,15,911-922(2007)
[14] Hou,Z.Y.,(Ca_7 Mg_3)金属玻璃中的短程和中程有序,J.Appl。物理。,107083511(2010年)
[15] Dong,K.J.,大型液态金属原子系统凝固过程模拟的并行算法,Trans。非费尔。遇见。中国社会科学院,040824-06(2003)
[16] 凯文·鲍尔斯(Kevin J.Bowers)。;周,E。;徐华峰;罗恩·德罗(Ron O.Dror)。;Eastwood,Michael P.,商品集群分子动力学模拟的可缩放算法,(ACM/IEEE SC’,第06卷(2006)),7695-7700
[17] 马其顿,M.,GPU进入计算主流,IEEE Comput。,36, 106-108 (2003)
[18] NVIDIA CUDA主页
[20] 马丁森,P。;布拉斯科,J。;Knnemeyer,R。;Jordan,R.,《使用NVIDIA@/图形处理器加速蒙特卡罗模拟》,计算。物理学。社区。,180, 10, 1983-1989 (2009)
[21] Januszewski,M。;Kostur,M.,用CUDA加速随机微分方程的数值解,计算。物理学。社区。,181, 1, 183-188 (2010) ·Zbl 1205.65024号
[22] Stone,J.E.,《使用图形处理器加速分子建模应用程序》,J.Compute。化学。,28, 16, 2618-2640 (2007)
[23] 安德森,A.G。;戈达德,W.A。;Schroder,P.,图形处理单元上的量子蒙特卡罗,计算。物理学。社区。,177, 298-306 (2007) ·Zbl 1196.81044号
[24] Collange,S。;Daumas,M。;Defour,D.,图形处理单元上的逐行光谱模拟,计算。物理学。社区。,178, 135-143 (2008)
[25] Belleman,R.G。;Bdorf,J。;Portegies Zwart,S.F.,图形处理单元上的高性能直接引力N体模拟II:在CUDA中的实现,New Astron。,13, 103-112 (2008)
[26] 刘伟。;施密特,B。;沃斯,G。;Mller-Wittig,W.,GPU上生物序列比对的流算法,IEEE Trans。并行分配系统。,18, 9, 1270-1281 (2007)
[27] Schatz,M.C。;特拉普内尔,C。;Delcher,A.L。;Varshney,A.,使用图形处理单元进行高通量序列比对,BMC Bioninform。,8, 474 (2007)
[28] Elsen,E。;维沙尔五世。;休斯顿,M.,GPU上的N体模拟(2007)
[29] 王,S。;Lai,S.K.,液态二元合金的结构和电阻率,J.Phys。F、 102717、2737(1980)
[30] Li,D.H.,亥姆霍兹自由能的变分计算及其在sp型液态金属中的应用,J.Phys。F、 18309-321(1986年)
[31] 赖,S.K。;Matsuura,M。;Wang,S.,简单液态金属和碱合金的变分热力学计算,J.Phys。F、 会议。物理。,13, 10, 2033 (1983)
[32] Nakano,H。;齐,D.W。;Wang,S.,亚稳体系的变分计算:玻璃转变的热力学性质,化学杂志。物理。,90, 1871 (1989)
[33] Jin,Z.H。;卢克。;Gong,Y.D.,《过冷GaZnMg金属液体中的玻璃转变和原子结构:恒压分子动力学研究》,J.Chem。物理。,106, 8830 (1997)
[34] Allen,M.P.,《分子动力学模拟导论》,(《计算软物质——从合成聚合物到蛋白质》,《计算软材料——从合成高分子到蛋白质》NIC系列,第23卷(2004年),约翰·冯·诺依曼计算研究所),1-28
[35] Plimpton,S.,《短程分子动力学快速并行算法》,J.Compute。物理。,117, 1-19 (1995) ·Zbl 0830.65120号
[36] 季旭、侯朝峰;王鹏;黄文来;王晓伟;葛伟;何宪峰;郭,李;李静海,天河1A上晶体硅的Petascale分子动力学模拟,国际期刊高性能计算。申请。,2012年1月11日
[37] NVIDIA CUDA计算统一设备架构编程指南(V1.1)(2007年11月)
[38] Myung,H.J。;Sakamaki,R。;哦,K.J.,使用图形处理单元加速分子动力学模拟,Bull。韩国化学。Soc.,31,12,3639-3643(2010年)
[39] Trott,C.R。;温特菲尔德,L。;Crozier,P.S.,基于GPU集群的通用分子动力学模拟(2010)
[40] 利普斯科姆,T.J。;邹,A。;Cho,S.S.,用于GPU优化MD模拟的并行verlet邻域列表算法,(《ACM生物信息学会议论文集》,《ACM关于生物信息学、计算生物学和生物医学会议论文集(2012)》,ACM),321-328
[41] 雪莱,J.C。;雪莱,M.Y。;Reeder,R.C.,磷脂模拟的粗粒模型,物理学杂志。化学。B、 105、19、4464-4470(2001)
[42] 哦,K.J。;Deng,Y.,用于分子动力学模拟的光滑粒子网格Ewald方法的高效并行实现,计算。物理学。社区。,177, 5, 426-431 (2007) ·Zbl 1196.82059号
[43] 哦,K.J。;Klein,M.L.,NPT系综中键约束分子系统的并行分子动力学模拟方案,计算。物理学。社区。,174, 4, 263-269 (2006)
[44] 西安,王;Takayuki,Aoki,在GPU集群上用格子Boltzmann方法计算不可压缩流的Multi-GPU性能,并行计算。,37, 521-535 (2011)
[45] 早稻田,Y.,《非晶材料的结构》,第270卷(1980年),麦格劳-希尔:麦格劳–希尔纽约
[46] 秋池平田;关鹏飞;Fujita,Takeshi,金属玻璃中局部原子顺序的直接观察,Nat.Mater。,10, 28-33 (2011)
[47] 阿比纳夫·巴特雷;萨米尔·库马尔(Sameer Kumar);梅,赵;詹姆斯·菲利普斯(James C.Phillips)。;郑耿彬;Kale,Laxmikant V.,《克服跨多平台生物分子模拟中的缩放挑战》,《并行分布程序》。,1530-2075 (2008)
[48] 斯帕福德,K。;Meredith,J.S。;Vetter,J.S.,《量化多gpu系统中的numa和竞争效应》,(图形处理单元通用处理第四次研讨会论文集(2011),ACM),11
[49] Chen,L。;O.维拉。;Krishnamoorthy,S.,单GPU和多GPU系统上的动态负载平衡,(IEEE并行和分布式处理(IPDPS)国际研讨会(2010),IEEE),1-12
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。