×

在ELPA-AEO和ESSEX-II特征解算器项目中使用混合精度计算的好处。 (英语) Zbl 1418.65044号

摘要:我们首先简要报告了ELPA-AEO(Petaflop应用的特征值解算器-算法扩展和优化)和ESSEX II(Exascale的稀疏解算器装备)项目的现状和最新成就。在这两项合作中,来自应用领域的科学家、数学家和计算机科学家共同开发并提供高效的高并行方法来解决特征值问题。然后,我们将重点放在两个项目中讨论的一个主题上,即使用混合精度计算来提高效率。我们更详细地描述了我们在三个选定的上下文中从较低或较高精度中获益的方法,以及由此获得的结果。

MSC公司:

2015财年65 矩阵特征值和特征向量的数值计算
65层25 数值线性代数中的正交化
2005年5月 并行数值计算
65岁99岁 数值算法的计算机方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alvermann,A.、Basermann,A.、Fehske,H.、Galgon,M.、Hager,G.、Kreutzer,M.,Krämer,L.、Lang,B.、Pieper,A.、Röhrig-Zöllner,M.和Shahzad,F.、Thies,J.、Wellein,G.:ESSEX:为exascale配备稀疏解算器。收录于:Lopes,L.等人(编辑)《2014年欧洲-巴黎:平行加工车间》,LNCS,Springer,第8806卷,第577-588页(2014)
[2] Auckenthaler,T.、Blum,V.、Bungartz,H.J.、Huckle,T.,Johanni,R.、Krämer,L.、Lang,B.、Lederer,H.、Willems,P.R.:电子结构计算中部分对称特征值问题的并行解。并行计算。37(12), 783-794 (2011) ·doi:10.1016/j.parco.2011.05.002
[3] Baboulin,M.,Buttari,A.,Dongarra,J.,Kurzak,J.、Langou,J.和Luszczek,P.,Tomov,S.:用混合精度算法加速科学计算。计算。物理学。Comm.180(12),2526-2533(2009)·Zbl 1197.65240号 ·doi:10.1016/j.cpc.2008.11.005
[4] Blum,V.、Gehrke,R.、Hanke,F.、Havu,P.、Hawu,V.,Ren,X.、Reuter,K.、Schefler,M.:数值原子中心轨道的从头算分子模拟。计算。物理学。Comm.180、2175-2196(2009年)·Zbl 1197.81005号 ·doi:10.1016/j.cpc.2009.06.022
[5] 坎农,L.E.:一台实现卡尔曼滤波算法的蜂窝计算机。蒙大拿州立大学博士论文(1969年)
[6] Carbogno,C.,Levi,C.G.,Van de Walle,C.G..,Schefler,M.:掺杂氧化锆的铁弹性开关:从第一原理建模和理解。物理学。版本B 90,144109(2014)·doi:10.103/物理版本B.90.144109
[7] Carbogno,C.,Ramprasad,R.,Schefler,M.:固体导热性的Ab Initio Green-Kubo方法。物理学。修订稿。118(17), 175901 (2017) ·doi:10.1103/PhysRevLett.118.175901
[8] Demmel,J.、Grigori,L.、Hoemmen,M.、Langou,J.:通信优化并行和序列QR及LU因子分解。SIAM J.科学。计算。34(1),A206-A239(2012)·Zbl 1241.65028号 ·doi:10.1137/080731992年
[9] Galgon,M.、Krämer,L.、Lang,B.:通过自适应技术改进基于投影的特征解算器。数字。线性代数应用。25(1),e2124(2017)·Zbl 1499.65126号 ·数字对象标识代码:10.1002/nla.2124
[10] Gavin,B.,Polizzi,E.:Krylov特征值策略,使用FEAST算法进行不精确系统求解。数字。线性代数应用。第2188页(2018年)·Zbl 1513.65096号
[11] Havu,V.,Blum,V.,Havu,P.,Scheffler,M.:使用数值基函数进行全电子电子结构计算的高效\[O(N)O(N)\]积分。J.计算。物理学。228(22), 8367-8379 (2009) ·邮编:1180.82004 ·doi:10.1016/j.jcp.2009.08.008
[12] Hoemmen,M.:避免通信的Krylov子空间方法。加州大学伯克利分校博士论文(2010)
[13] Kreutzer,M.、Hager,G.、Wellein,G.,Fehske,H.、Bishop,A.R.:一种统一的稀疏矩阵数据格式,用于在具有宽SIMD单元的现代处理器上进行高效的通用稀疏矩阵-向量乘法。SIAM J.科学。计算。36(5),C401-C423(2014)·Zbl 1307.65055号 ·doi:10.1137/130930352
[14] Kreutzer,M。;Thies,J。;Pieper,A。;Alvermann,A。;加尔贡,M。;Röhrig-Zöllner,M。;沙赫扎德,F。;Basermann,A。;阿联酋主教;Fehske,H。;海格·G。;Lang,B。;Wellein,G。;Bungartz,HJ(编辑);Neumann,P.(编辑);Nagel,WE(编辑),异构超级计算机上大型稀疏特征值计算构建块的性能工程和能效,第113号,317-338(2016),瑞士
[15] Kreutzer,M.、Thies,J.、Röhrig-Zöllner,M.,Pieper,A.、Shahzad,F.、Galgon,M.和Basermann,A.、Fehske,H.、Hager,G.、Wellein,G.:GHOST:异构系统上高性能稀疏线性代数的构建块。国际期刊并行程序。45(5), 1046-1072 (2016) ·doi:10.1007/s10766-016-0464-z
[16] Kühne,T.D.,Krack,M.,Mohamed,F.R.,Parrinello,M.:Born-Oppenheimer分子动力学的高效准确类Car-Parrinelo方法。物理学。修订稿。98(6), 066401 (2007) ·doi:10.1103/PhysRevLett.98.066401
[17] Lang,B.:带状厄米特正定广义特征值问题到带状标准特征值问题的有效约简。SIAM J.科学。计算。41(1),C52-C72(2019)·Zbl 1455.65055号 ·doi:10.1137/18M1167322
[18] Manin,V.,Lang,B.:将广义hpd特征问题简化为标准形式的Cannon-type三角矩阵乘法(2018)(已提交)
[19] Marek,A.、Blum,V.、Johanni,R.、Havu,V.,Lang,B.、Auckenthaler,T.、Heinecke,A.,Bungartz,H.J.、Lederer,H.:ELPA库:电子结构理论和计算科学的可缩放并行特征值解。物理杂志:康登斯。第26(21)条,213201(2014)
[20] Muller,J.M.,Brisebarre,N.,de Dinechin,F.,Jeannerod,C.P.,Lefèvre,V.,Melquiond,G.,Revol,N.,Stehlé,D.,Torres,S.:浮点运算手册。柏林施普林格出版社(2010年)·Zbl 1197.65001号 ·doi:10.1007/978-0-8176-4705-6
[21] Nemec,L.,Blum,V.,Rinke,P.,Schefler,M.:SiC上石墨烯薄膜的热力学平衡条件。物理学。修订稿。111(6), 065502 (2013) ·doi:10.1103/PhysRevLett.111.065502
[22] Pieper,A.、Kreutzer,M.、Alvermann,A.、Galgon,M.,Fehske,H.、Hager,G.、Lang,B.、Wellein,G.:内部特征值计算中切比雪夫滤波器对角化的高性能实现。J.计算。物理学。325, 226-243 (2016) ·Zbl 1376.65055号 ·doi:10.1016/j.jcp.2016.08.027
[23] Polizzi,E.:求解特征值问题的基于密度矩阵的算法。物理学。版本B 79(11),115112(2009)·doi:10.1103/PhysRevB.79.115112
[24] Röhrig-Zöllner,M.,Thies,J.,Kreutzer,M.、Alvermann,A.、Pieper,A.、Basermann,A.、Hager,G.、Wellein,G.,Fehske,H.:通过阻塞提高Jacobi-Davidson方法的性能。SIAM J.科学。计算。37(6),C697-C722(2015)·Zbl 1329.65077号 ·doi:10.1137/140976017
[25] Rouet,F.H.,Li,X.S.,Ghysels,P.,Napov,A.:使用随机化进行密集分层半可分矩阵计算的分布式内存包。ACM事务处理。数学。柔和。42(4), 27:1-27:35 (2016) ·Zbl 1369.65043号
[26] Saad,Y.:大型特征值问题的数值方法,第2版。费城工业与应用数学学会(2011)·Zbl 1242.65068号 ·doi:10.1137/1.9781611970739
[27] Sakurai,T.,Sugiura,H.:使用数值积分的广义特征值问题的投影方法。J.计算。申请。数学。159(1), 119-128 (2003) ·兹比尔1037.65040 ·doi:10.1016/S0377-0427(03)00565-X
[28] Sakurai,T.,Tadano,H.:CIRR:广义特征值问题的一种具有轮廓积分的Rayleigh-Riz型方法。北海道数学。J.36,745-757(2007)·Zbl 1156.65035号 ·doi:10.14492/hokmj/1272848031
[29] Schönemann,P.H.:正交Procrustes问题的广义解。《心理测量学》31(1),1-10(1966)·Zbl 0147.19401号 ·doi:10.1007/BF02289451
[30] Shahzad,F.、Thies,J.、Kreutzer,M.、Zeiser,T.、Hager,G.、Wellein,G.:CRAFT:一个更容易实现应用级检查点/重启和自动容错的库(2017)。预印本:arXiv:1708.02030(已提交)
[31] Song,W.,Wubs,F.,Thies,J.,Baars,S.:三维图灵型反应扩散模型的数值分歧分析。Commun公司。非线性科学。数字。模拟。60, 145-164 (2018) ·Zbl 1470.65183号 ·doi:10.1016/j.cnsns.2018.01.003
[32] Stathopoulos,A.,Wu,K.:具有恒定同步要求的块正交化过程。SIAM J.科学。计算。23(6), 2165-2182 (2002) ·Zbl 1018.65050号 ·doi:10.1137/S1064827500370883
[33] Stewart,G.W.:块Gram-Schmidt正交化。SIAM J.科学。计算。31(1), 761-775 (2008) ·Zbl 1185.65069号 ·数字对象标识代码:10.1137/070682563
[34] Thies,J。;加尔贡,M。;沙赫扎德,F。;Alvermann,A。;Kreutzer,M。;Pieper,A。;Röhrig-Zöllner,M。;Basermann,A。;Fehske,H。;海格·G。;Lang,B。;Wellein,G。;Bungartz,HJ(编辑);Neumann,P.(编辑);Nagel,WE(编辑),《迈向支持exascale的稀疏解算器存储库》,第113期,295-316(2016),瑞士
[35] Yamamoto,Y.,Nakatsukasa,Y.、Yanagisawa,Y.和Fukaya,T.:Cholesky QR2算法的舍入误差分析。电子。事务处理。数字。分析。44, 306-326 (2015) ·Zbl 1330.65049号
[36] Yamazaki,I.,Tomov,S.,Dong,T.,Dongarra,J.:用于提高CA-GMRES在GPU上的稳定性和性能的混合精度正交化方案和自适应步长。收录于:Daydé,M.J.,Marques,O.,Nakajima,K.(编辑)计算科学的高性能计算-VECPAR 2014-11国际会议,尤金,俄勒冈州,美国,2014年6月30日至7月3日,修订论文集,计算机科学讲义,第8969卷,第17-30页。施普林格(2014)·Zbl 07631077号
[37] Yamazaki,I.、Tomov,S.、Dongarra,J.:混合精度Cholesky QR分解及其在多GPU多核CPU上的案例研究。SIAM J.科学。计算。37(3),C307-C330(2015)·Zbl 1320.65046号 ·数字对象标识代码:10.1137/14M0973773
[38] Yu,V.W.,Corsetti,F.,García,a.,Huhn,W.P.,Jacquelin,M.,Jia,W.,Lange,B.,Lin,L.,Lu,J.,Mi,W。,Yang,C.,Yang,H.,Blum,V.:ELSI:科恩-沙姆电子结构求解器的统一软件接口。计算。物理学。Comm.222、267-285(2018年)·兹伯利07693050 ·doi:10.1016/j.cpc.2017.09.007
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。