×

大规模电子态计算中广义实对称特征值问题的后验验证方法。 (英语) Zbl 1439.65046号

本文的物理背景是计算材料科学。具体而言,作者希望研究用于确定电子能量和波函数的基本薛定谔型方程的解,以表征材料的特性。
所处理的线性偏微分方程的数值解给出了在正交条件({x_i}^TB{x_j}=1,\text{if}i=j,0\text{otheral})下的广义特征值问题(GEP),其中(a)和(B)都是实对称矩阵(n次n次),其中为正定,并假设\({\lambda}_1\leq{\lampda}_2\leq\ldots\leq{\ lambda{n)。本征值表示材料中电子的能量,对应的本征向量是波函数。
附录中给出了线性薛定谔方程GEP的推导过程,并参考了教科书。
基体尺寸与不同材料中分子、原子或电子的数量大致成正比。因此,大规模广义特征值问题必须使用大规模并行超级计算机进行工业应用。这些问题的特征值大多密集聚集或几乎退化,难以区分。序列特征值的差异往往与(frac{1}{n})成正比。此外,为了有效地计算这种大规模计算,使用了较低精度的算法,例如单精度或甚至半精度的算法。许多著名的广义特征值问题的求解器都是并行化的,并且很难克服上述问题。因此,作者开发了一种后验验证程序,以了解GEP求解器的近似解与精确解之间的差异。
为了验证该算法,作者考虑了GEP的以下四个部分:(i)B的Cholesky分解,(ii)标准特征值问题(SEP)的约简,(iii)SEP的解,(iv)特征向量的变换。步骤(I)、(ii)和(iv)被称为减速器,步骤(iii)是SEP解算器。作者指出,20世纪90年代开发的标准并行数值库ScaLAPACK在现代大规模并行超级计算机上显示出严重的瓶颈。作者介绍了在日本旗舰超级计算机K计算机上使用相应的ScaLATACK例程作为特征值求解器创建的验证过程的结果。
但是,他们提到也有ELPA(欧洲开发)和EigenExa(日本开发)的新型求解器库,它们应该可以克服上述ScaLAPACK的瓶颈。为未来版本提供了混合工作流的示意图,其中还包括新的SEP解决方案。后验方法基于标准特征值问题的Wilkinson界、所有计算特征值误差界的验证、Gershgorin圆定理和Yamamoto定理的变体。详细演示了相应的代码。验证器过程主要使用矩阵乘法。因此,与具有更耗时的Cholesky分解和三对角化的求解程序相比,验证算法的计算时间是适中的。
测试数据来自ELSES矩阵库,主要用于有机聚合物系统。最大的矩阵问题属于使用6400个处理器节点的矩阵维数为\(n=430.080 \)的纳米复合碳固体。表和图显示,验证算法提供了包含准确特征值的区间,并显示了计算时间和使用的处理器节点数。
如果使用低精度算法作为初始猜测,为了有效地计算大规模问题,将宣布验证技术的未来使用问题,并且需要在混合精度计算中进行改进。

MSC公司:

2015财年65 矩阵特征值和特征向量的数值计算
65G20个 具有自动结果验证的算法
65Z05个 科学应用
60年第68季度 规范和验证(程序逻辑、模型检查等)
68号30 软件工程的数学方面(规范、验证、度量、需求等)
35J10型 薛定谔算子
74平方米 谱及相关方法在固体力学问题中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 特征内核,https://github.com/eigenkernel/。
[2] Imachi,H。;Hoshi,T.,《用于大规模并行特征值计算的混合数值解算器及其与电子结构计算的基准》,J.Inf.Process。,24, 164-172 (2016)
[3] 田中,K。;Imachi,H。;Fukumoto,T。;Fukaya,T。;Yamamoto,Y。;Hoshi,T.,Eigenkernel-一种用于并行广义特征值求解器的中间件,以实现高可扩展性和可用性,日本J.Ind.Appl。数学。,36, 719-742 (2019) ·兹比尔1418.65051
[4] Yamamoto,N.,对称矩阵特征值误差界的一种简单方法,线性代数应用。,324, 1-3, 227-234 (2001) ·Zbl 0981.65042号
[5] 南岛宫岛。;大吉田,T。;臀部,S.M。;Oishi,S.,对称正定广义特征值问题中所有特征对的快速验证,Reliab。计算。,14, 24-45 (2010)
[6] Miyajima,S.,广义特征值问题中每个特征值的数值封闭,J.计算。申请。数学。,236, 9, 2545-2552 (2012) ·Zbl 1248.65039号
[7] Yamamoto,T.,方程组近似解的误差界,日本J.Appl。数学。,1, 1, 157-171 (1984) ·Zbl 0571.65035号
[8] J.Dongarra,《极限规模计算的问题和解决方案》,载于:HPC Asia 2018,日本东京,2018年。
[9] 阿尔弗曼,A。;Basermann,A。;H.J.本加兹。;Carbogno,C。;Ernst,D。;Fehske,H。;Futamura,Y。;加尔贡,M。;海格·G。;Huber,S。;哈克尔,T。;艾达;Imakura,A。;卡瓦伊,M。;Köcher,S。;Kreutzer,M。;库斯,P。;B.朗。;莱德尔,H。;马宁,V。;马雷克,A。;Nakajima,K。;Nemec,L。;路透社,K。;里普尔,M。;Röhrig-Zöllner,M。;樱井,T。;谢夫勒,M。;Scheurer,C。;沙赫扎德,F。;Brambila,D.S。;Thies,J。;Wellein,G.,在ELPA-AEO和ESSEX-II特征解算器项目中使用混合精度计算的好处,日本J.Ind.Appl。数学。,36, 699-717 (2019) ·Zbl 1418.65044号
[10] 细石,T。;Imachi,H。;Kuwata,A。;Kakuda,K。;Fujita,T。;松井,H.,柔性器件材料大规模电子状态计算的数值方面,日本J.Ind.Appl。数学。,36, 685-698 (2019) ·Zbl 1418.65048号
[11] 贝尔·R。;Dean,P.,玻璃态二氧化硅中的原子振动,圆盘。法拉第社会,50,55-61(1970)
[12] 藤原,T。;三井,T。;Yamamoto,S.,准晶体中波函数和传输系数的标度性质,Phys。B版,53,R2910-R2913(1996)
[13] ScaLAPACK、,http://www.netlib.org/scalapack/。
[14] 布莱克福德,L.S。;Choi,J。;克利里,A。;D’Azevedo,E。;德梅尔,J。;迪尔隆,I。;Dongarra,J。;Hammarling,S。;亨利,G。;佩蒂特,A。;斯坦利,K。;Walker,D。;Whaley,R.C.,ScaLAPACK用户指南(1997),工业和应用数学学会·兹伯利0886.65022
[15] ELPA(=千兆次浮点应用的特征值求解器),https://elpa.mpcdf.mpg.de/。
[16] 马雷克,A。;布鲁姆,V。;Johanni,R。;哈夫,V。;B.朗。;奥肯塔勒,T。;海涅克,A。;Bungartz,H。;Lederer,H.,ELPA库-电子结构理论和计算科学的可扩展并行特征值解决方案,J.Phys。康登斯。物质,2623201(2014)
[17] 特征Exa,http://www.r-ccs.riken.jp/labs/lpnctrt/en/projects/eigenexa/。
[18] Imamura,T。;Y.Hirota。;Fukaya,T。;山田,S。;Machida,M.,Eigenexa:高性能密集特征解算器,现在和未来,(第八届并行矩阵算法和应用国际研讨会(PMAA14),瑞士卢加诺(2014))
[19] FHI-AIM(=弗里茨-哈伯研究所从头算分子模拟),https://aimsclub.fhi-berlin.mpg.de/。
[20] 布鲁姆,V。;Gehrke,R。;汉克,F。;Havu,P。;哈夫,V。;任,X。;路透社,K。;Schefler,M.,数值原子中心轨道的从头算分子模拟,计算。物理。Comm.,180,2175-2196(2009)·Zbl 1197.81005号
[21] Rump,S.M.,快速和并行区间算术,BIT,39,3,539-560(1999)
[22] C-XSC-扩展科学计算的C++类库,2.5.4版,http://www.xsc.de/。
[23] Rump,S.M.,INTLAB-interval laboratory,(Csendes,T.,《可靠计算的发展》(1999),Kluwer Academic Publishers:Kluwer-Academic Publishers Dordrecht),77-104·Zbl 0949.65046号
[24] Wilkinson,J.H.,计算特征系统的严格误差界,计算。J.,4230-241(1961)·Zbl 0109.34504号
[25] Lee,D。;Hoshi,T。;Sogabe,T。;宫崎骏,Y。;张士乐,大型电子结构计算中第k特征值问题的求解,计算机学报。物理。,371, 618-632 (2018) ·Zbl 1415.65088号
[26] Wilkinson,J.H.,《代数特征值问题》(1965),克拉伦登出版社:牛津克拉伦登出版公司·Zbl 0258.65037号
[27] ELSES(=超大规模电子结构计算),http://www.elses.jp/。
[28] Hoshi,T。;山本,S。;藤原,T。;Sogabe,T。;Zhang,S.-L.,具有广义本征值方程的有序(N)电子结构理论及其在千万原子系统中的应用,J.Phys.:康登斯。Matter,24,第165502条pp.(2012),1-5
[29] T.Hoshi,H.Imachi,K.Kumahata,M.Terai,K.Miyamoto,K.Minami,F.Shoji,在K计算机的整个系统上模拟(10{}^8)原子量子材料的极可伸缩算法,in:Proc。SC16中的比例A16,第33-40页。
[30] ELSES矩阵库,http://www.elses.jp/matrix/。
[31] Hoshi,T。;秋山,Y。;田中,T。;Ohno,T.,利用大规模并行N阶理论在K计算机上计算Ten-million原子电子结构,J.Phys。日本社会,82023710/1-4(2013)
[32] 大吉田,T。;Aishima,K.,对称特征值分解的迭代精化,日本工业应用杂志。数学。,35, 3, 1007-1035 (2018) ·Zbl 1403.65018号
[33] 大吉田,T。;Aishima,K.,对称特征值分解的迭代求精II:聚集特征值,日本J.Ind.Appl。数学。,36, 2, 435-459 (2019) ·Zbl 1418.65049号
[34] Martin,R.M.,《电子结构-基本理论和实用方法》(2004),剑桥大学出版社·Zbl 1152.74303号
[35] 阿特金斯,P。;弗里德曼,R.,《分子量子力学》(2005),牛津大学出版社
[36] Slater,J.C.,原子屏蔽常数,物理。修订版,36,57-64(1930)·JFM 56.1313.02号机组
[37] Lesiuk,M。;Moszynski,R.,重新检查Slater型轨道上双中心双电子积分的计算。I.库仑积分和混合积分,物理学。修订版E,9063318/1-13(2014)
[38] Nath,K。;安德森,A.B.,原子叠加和电子离域紧束缚带理论,物理学。版本B,41,5652-5660(1990)
[39] Calzaferri,G。;Rytz,R.,《金刚石的能带结构》,J.Phys。化学。,100, 11122-11124 (1996)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。