×

用于基态第一原理计算和材料统计物理的局部自洽多重散射代码的GPU加速。 (英语) Zbl 1376.81080号

小结:局部自洽多重散射(LSMS)代码解决了第一原理密度泛函理论Kohn-Sham方程,适用于各种材料,特别是金属、合金和金属纳米结构。传统上,它在大规模并行高性能计算机体系结构上表现出近乎完美的可扩展性。我们致力于利用GPU加速LSMS代码,以实现原子的第一原理计算和有限温度特性的统计物理采样。我们使用仅使用加速器内存的块矩阵反演算法重新实现了GPU的散射矩阵计算。使用橡树岭领先计算设施的Cray XK7系统Titan,我们实现了14.5PFlop/s的持续性能,与仅使用CPU的代码相比,速度提高了8.6。

MSC公司:

81V70型 多体理论;量子霍尔效应
65二氧化碳 蒙特卡罗方法
65楼30 其他矩阵算法(MSC2010)
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Hohenberg,P。;科恩·W·物理学。版本136,B864-B871(1964)
[2] 科恩,W。;Sham,L.J。,物理。修订版,140,A1133-A1138(1965)
[3] Korringa,J.,《物理学》,第13期,第392-400页(1947年)
[4] 科恩,W。;罗斯托克,N.,Phys。版次:941111-1120(1954)·Zbl 0055.44406号
[5] 埃伯特,H。;Ködderitzsch,D。;Minár,J.,众议员程序。物理。,74,第096501条pp.(2011)
[6] Wang,Y。;股票,总市值。;西澳州谢尔顿。;Nicholson博士。C。;Temmerman,W.M。;佐特克,Z.,Phys。修订稿。,75, 2867 (1995)
[7] 艾森巴赫,M。;Györffy,B.L。;股票,总市值。;ru jfalussy,B.,物理学。B版,65,第144424条pp.(2002)
[8] 股票,总市值。;艾森巴赫,M。;u jfalussy,B。;拉扎罗维茨,B。;Szunyogh,L。;温伯格,P.,Prog。马特。科学。,52, 2-3, 371-387 (2007)
[9] 北卡罗来纳州大都会。;罗森布鲁斯,A.W。;Rosenbluth,M.N。;出纳员,A.H。;Teller,E.,J.化学。物理。,21, 1087 (1953) ·Zbl 1431.65006号
[10] Wang,F。;D.P.兰道。,物理。修订稿。,2050-2053年10月86日(2001年)
[11] Wang,F。;D.P.兰道。,物理。E版,64,第056101条,pp.(2001)
[12] 艾森巴赫,M。;周,C.-G。;Nicholson,D.M。;布朗,G。;Larkin,J。;T.C.Schulthess。,(《高性能计算网络、存储和分析会议论文集》,SC'09(2009),ACM:ACM纽约,纽约,美国),64:1-64:8
[13] 艾森巴赫,M。;Nicholson,D.M。;鲁萨努,A。;Brown,G.,J.应用。物理。,109、7、07E138(2011)
[14] Nicholson,D.M。;Odbadrakh,K。;鲁萨努,A。;艾森巴赫,M。;布朗,G。;B.M.埃文斯。,J.应用。物理。,109、7、07A942(2011)
[15] Khan,S.N。;艾森巴赫,M.,物理学。B版,93,2,第024203条,pp.(2016)
[16] 斯汤顿,J。;Gyorffy,B.,Phys(物理学)。修订稿。,69, 371-374 (1992)
[17] 尹,J。;Landau,D.,计算。物理。Comm.,183,8,1568-1573(2012)
[18] 沃格尔,T。;李永伟。;Wüst,T。;D.P.兰道。,物理。修订稿。,110,第210603条pp.(2013)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。