×

特征值切片库(EVSL):算法、实现和软件。 (英语) 1420.65050兹罗提

摘要:本文描述了一个名为EVSL(特征值切片库)的软件包,用于解决大型稀疏实对称标准和广义特征值问题。顾名思义,该软件包利用了频谱切片技术,该策略包括将频谱划分为若干子区间,并从每个子区间独立提取特征对。为了实现这种策略,EVSL中的方法利用给定矩阵(或矩阵对)的光谱密度的快速计算。EVSL与其他可用软件包的区别在于EVSL完全依赖于过滤技术。实现了多项式类和有理类滤波,并与Krylov子空间方法和子空间迭代耦合。在实现上,该软件包为各种场景提供了接口,包括无矩阵方法,从而可以提供用户特定的函数来执行矩阵向量运算或求解线性系统。本文描述了EVSL中的算法,详细介绍了它们的实现,并讨论了各种方法和各种计算平台上的性能问题。

MSC公司:

2015财年65 矩阵特征值和特征向量的数值计算
65层25 数值线性代数中的正交化
65层50 稀疏矩阵的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.Anderson、Z.Bai、C.Bischof、S.Blackford、J.Demmel、J.Dongarra、J.Du Croz、A.Greenbaum、S.Hammarling、A.McKenney和D.Sorensen,LAPACK用户指南第三版,SIAM,费城,1999年·Zbl 0934.65030号
[2] X.Andrade、D.A.Strubbe、U.De Giovannini、A.H.Larsen、M.J.T.Oliveira、J.Alberdi-Rodriguez、A.Varas、I.Theophilou、N.Helbig、M.Verstraete、L.Stella、F.Nogueira、A.Aspuru-Guzik、A.Castro、M.A.L.Marques和A.Rubio,真实空间网格和章鱼代码作为开发电子系统新仿真方法的工具,物理。化学。化学。物理。,17(2015),第31371-31396页。
[3] P.Arbenz、R.Geus和S.Adam,加速腔的Maxwell特征值问题的求解,物理。修订规范顶部。加速度。《梁》,4(2001),022001。
[4] J.Asakura、T.Sakurai、H.Tadano、T.Ikegami和K.Kimura,利用轮廓积分求解非线性特征值问题的数值方法,JSIAM信函。,1(2009年),第52-55页·Zbl 1278.65072号
[5] J.Aurentz、V.Kalantzis和Y.Saad,Cucheb:过滤Lanczos程序的GPU实现,计算。物理学。社区。,220(2017年),第332-340页·Zbl 1411.65005号
[6] J.Baglama、D.Calvetti和L.Reichel,算法827:irbleigs:MATLAB程序,用于计算大型稀疏厄米矩阵的几个特征对,ACM变速器。数学。《软件》,29(2003),第337-348页·Zbl 1070.65529号
[7] C.G.Baker、U.L.Hetmaniuk、R.B.Lehoucq和H.K.Thornquist,用于大规模特征值问题数值求解的Anasazi软件,ACM变速器。数学。软件,36(2009),13·Zbl 1364.65083号
[8] N.Bell和M.Garland,CUDA上的高效稀疏矩阵向量乘法,NVIDIA技术报告NVR-2008-004,NVIIDA Corporation,Santa Clara,CA,2008年。
[9] N.Bell和M.Garland,在面向吞吐量的处理器上实现稀疏矩阵-向量乘法,《高性能计算网络、存储和分析会议记录》,SC'09,纽约,2009,ACM,纽约,2009,18。
[10] M.Bollhoïfer和Y.Notay,JADAMILU:计算大型稀疏对称矩阵选定特征值的软件代码,计算。物理学。社区。,177(2007),第951-964页·Zbl 1196.65072号
[11] A.Buluc、S.Williams、L.Oliker和J.Demmel,稀疏矩阵向量乘法的减少带宽多线程算法,《并行和分布式处理研讨会(IPDPS)》,2011年IEEE,新泽西州皮斯卡塔韦,2011年,第721-733页。
[12] W.R.Burdick、Y.Saad、L.Kronik、M.Jain和J.Chelikowsky,含时密度泛函理论的并行实现,计算。物理学。社区。,156(2003),第22-42页。
[13] Y.Chen、T.A.Davis、W.W.Hager和S.Rajamanickam,算法887:Cholmod、超节点稀疏Cholesky分解和更新/停机,ACM变速器。数学。软件,35(2008),22。
[14] M.Christen、O.Schenk和H.Burkhart,使用NVIDIA CUDA技术平台的通用稀疏矩阵构建块,《图形处理单元通用处理第一次研讨会》,2007年,第32页。
[15] J.W.Daniel、W.B.Gragg、L.Kaufman和G.W.Stewart,更新Gram-Schmidt QR分解的重正交化和稳定算法,数学。公司。,30(1976年),第772-795页·Zbl 0345.65021号
[16] T.Davis,稀疏线性系统的直接方法,Fundam。算法,SIAM,费城,2006年·Zbl 1119.65021号
[17] T.A.Davis,算法832:Umfpack v4.3–一种非对称模式的多波前方法,ACM变速器。数学。《软件》,30(2004),第196-199页·Zbl 1072.65037号
[18] T.A.Davis和Y.Hu,佛罗里达大学稀疏矩阵集合,ACM变速器。数学。《软件》,38(2011),25·Zbl 1365.65123号
[19] J.J.Dongarra、J.Du Croz、S.Hammarling和I.S.Duff,一组三级基本线性代数子程序,ACM变速器。数学。软件,第16期(1990年),第1-17页·Zbl 0900.65115号
[20] J.J.Dongarra、J.Du Croz、S.Hammarling和R.J.Hanson,扩展的Fortran基本线性代数子程序集,ACM变速器。数学。《软件》,14(1988),第1-17页·Zbl 0639.65016号
[21] P.Giannozzi等人。,Quantum Expresso公司, http://www.quantum-espresso.org。
[22] H.R.Fang和Y.Saad,极值和内部特征值问题的滤波Lanczos过程,SIAM J.科学。计算。,34(2012年),第A2220-A2246页·Zbl 1253.65053号
[23] D.R.Fokkema、G.L.G.Sleijpen和H.A.van der Vorst,矩阵笔约简的Jacobi-Davidson型QR和QZ算法,SIAM J.科学。计算。,20(1998年),第94-125页·Zbl 0924.65027号
[24] L.Giraud、J.Langou、M.Rozložnik和J.Van Den Eshof,经典Gram-Schmidt正交化过程的舍入误差分析,数字。数学。,101(2005),第87-100页·Zbl 1075.65060号
[25] L.Giraud、J.Langou和M.Rozloznik,Gram-Schmidt正交化过程中的正交性损失,计算。数学。申请。,50(2005),第1069-1075页·Zbl 1085.65037号
[26] X.Gonze、J.-M.Beuken、R.Caracas、F.Detraux、M.Fuchs、G.-M.Rignaese、L.Sindic、M.Verstraete、G.Zerah、F.Jollet、M.Torrent、A.Roy、M.Mikami、Ph.Ghosez、J.-Y.Raty和D.C.Allan,材料特性的第一原理计算:ABINIT软件项目,公司。马特。科学。,25(2002),第478-492页。
[27] Y.Hasegawa、J.Iwata、M.Tsuji、D.Takahashi、A.Oshiyama、K.Minami、T.Boku、F.Shoji、A.Uno、M.Kurokawa、H.Inoue、I.Miyoshi和M.Yokawa,K计算机上含100000个原子的硅纳米线电子态的第一性原理计算,《2011年高性能计算、网络、存储和分析国际会议论文集》,SC'11,纽约,2011年,纽约ACM,2011年1月。
[28] V.Herna⁄ndez、J.E.Roma⁄n和V.Vidal,SLEPc:用于解决特征值问题的可扩展且灵活的工具包,ACM变速器。数学。《软件》,31(2005),第351-362页·Zbl 1136.65315号
[29] A.Klinvex、F.Saied和A.Sameh,稀疏对称特征值问题迹最小化方案tracemin的并行实现,计算。数学。申请。,65(2013),第460-468页·Zbl 1319.65027号
[30] A.V.Knyazev、M.E.Argentati、I.Lashuk和E.E.Ovtchinnikov,Hypre和PETSc中的块局部最优预处理特征值xolver(BLPOEX),SIAM J.科学。计算。,29(2007),第2224-2239页·Zbl 1149.65026号
[31] A.V.Knyazev,走向最优预处理特征解算器:局部最优块预处理共轭梯度法,SIAM J.科学。计算。,23(2001),第517-541页·Zbl 0992.65028号
[32] G.Kresse和J.J.Furthmuöller,使用平面波基集进行从头算总能量计算的有效迭代方案,物理。B版(3),54(1996),第11169-11186页。
[33] L.Kronik、A.Makmal、M.L.Tiago、M.M.G.Alemany、M.Jain、X.Huang、Y.Saad和J.R.Chelikowsky,PARSEC——用于实际空间电子结构计算的伪势算法:纳米结构的最新进展和新应用,物理。统计解决方案。B、 243(2006),第1063-1079页。
[34] C.兰索斯,应用分析1988年,纽约多佛。
[35] C.L.Lawson、R.J.Hanson、D.R.Kincaid和F.T.Krogh,Fortran使用的基本线性代数子程序,ACM变速器。数学。《软件》,第5卷(1979年),第308-323页·Zbl 0412.65022号
[36] R.B.Lehoucq、C.C.Yang和D.C.Sorensen,ARPACK用户指南:用隐式重启Arnoldi方法解决大规模特征值问题,SIAM,费城,1998年·Zbl 0901.65021号
[37] R.Li和Y.Saad,GPU加速的预处理迭代线性解算器,J.超级计算机。,63(2013),第443-466页。
[38] R.Li、Y.Xi、E.Vecharynski、C.Yang和Y.Saad,Hermitian特征值问题的多项式滤波厚重启Lanczos算法,SIAM J.科学。计算。,38(2016),第A2512-A2534页·Zbl 1348.65071号
[39] L.Lin、Y.Saad和C.Yang,大矩阵谱密度的近似SIAM Rev.,58(2016),第34-65页·Zbl 1338.15026号
[40] X.Liu、M.Smelyanskiy、E.Chow和P.Dubey,基于x86的多核处理器上的高效稀疏矩阵向量乘法,《第27届国际ACM国际超级计算会议论文集》,ACM,纽约,2013年,第273-282页。
[41] 英伟达,cuBLAS库用户指南,v8.0版,2018年10月,https://docs.nvidia.com/cuda/pdf/CUBLAS_Library.pdf。
[42] 英伟达,cuSPARSE Library用户指南,v10.0版,2018年10月,https://docs.nvidia.com/cuda/pdf/CUSPARSE_Library.pdf。
[43] B.N.Parlett,对称特征值问题,经典应用。数学。20,SIAM,费城,1998年·Zbl 0885.65039号
[44] E.波利齐,基于密度矩阵的特征值问题求解算法,物理。版本B(3),79(2009),115112。
[45] E.波利齐,用于求解特征值问题的高性能数值库:FEAST Solver v(2.0)用户指南,预印本,arXiv:1203.4031v12012。
[46] Y.Saad,大特征值问题的数值方法,经典应用。数学。66,费城SIAM,2011年·Zbl 1242.65068号
[47] T.樱井和H.杉浦,广义特征值问题的数值积分投影方法,J.计算。申请。数学。,159(2003),第119-128页,https://doi.org/10.1016/S0377-0427(03)00565-X·Zbl 1037.65040号
[48] T.樱井和H.塔达诺,CIRR:广义特征值问题的Rayleigh-Ritz型轮廓积分方法北海道数学。J.,36(2007),第745-757页,https://doi.org/10.14492/hokmj/1272848031。 ·Zbl 1156.65035号
[49] A.Sameh和Z.Tong,对称广义特征值问题的迹最小化方法,J.计算。申请。数学。,123(2000),第155-175页·Zbl 0964.65038号
[50] A.H.Sameh和J.A.Wisniewski,广义特征值问题的迹最小化算法,SIAM J.数字。分析。,19(1982),第1243-1259页·Zbl 0493.65017号
[51] O.Schenk、K.Gaërtner、W.Fichtner和A.Stricker,Pardiso:半导体器件仿真中的高性能串行和并行稀疏线性求解器,未来一代计算。系统。,18(2001),第69-78页·Zbl 1032.68172号
[52] G.Schofield、J.R.Chelikowsky和Y.Saad,Kohn-Sham问题的谱切片方法,计算。物理学。社区。,183(2012),第497-505页·Zbl 1264.82014年
[53] M.D.Segall、P.J.D.Lindan、M.J.Probert、C.J.Pickard、P.J.Hasnip、S.J.Clark和M.C.Payne,第一原理模拟:想法、插图和CASTEP代码《物理学杂志》。康登斯。Matter,14(2002),第2717-2744页。
[54] A.Stathopoulos和J.R.McCombs,PRIMME:预处理迭代多方法特征解算器:方法和软件描述,ACM变速器。数学。软件,37(2010),21·Zbl 1364.65087号
[55] A.Stathopoulos、Y.Saad和K.Wu,动态重启动Davidson和隐式重启动Arnoldi方法,SIAM J.科学。计算。,19(1998年),第227-245页·Zbl 0924.65028号
[56] P.S.Vassilevski和T.V.Kolev,使用(H1)辅助空间AMG预处理的H(curl)问题并行特征值求解器,技术报告,劳伦斯·利弗莫尔国家实验室,加利福尼亚州利弗莫尔,2006年。
[57] C.Voímel、S.Z.Tomov、O.A.Marques、A.Canning、L.Wang和J.J.Dongarra,用于大规模纳米系统电子结构计算的最新特征解算器,J.计算。物理。,227(2008),第7113-7124页·Zbl 1141.82346号
[58] Q.Wang、X.Zhang、Y.Zhangs和Q.Yi,AUGEM:在x86 CPU上自动生成高性能密集线性代数内核,《高性能计算、网络、存储和分析国际会议论文集》,SC'13,纽约,2013,ACM,纽约,2013,25。
[59] S.Williams、L.Oliker、R.Vuduc、J.Shalf、K.Yelick和J.Demmel,新兴多核平台上稀疏矩阵向量乘法的优化,摘自《超级计算》,2007年,美国计算机学会,2007年纽约,第1-12页。
[60] K.Wu、A.Canning、H.D.Simon和L.-W.Wang,电子结构计算的重启动Lanczos方法,J.计算。物理。,154(1999),第156-173页·Zbl 0963.82048号
[61] K.Wu和H.Simon,大型对称特征值问题的重启动Lanczos方法,SIAM J.矩阵分析。申请。,22(2000),第602-616页·Zbl 0969.65030号
[62] Y.Xi、R.Li和Y.Saad,广义特征值问题谱密度的快速计算,SIAM J.科学。计算。,40(2017年),第A2749-A2773页·Zbl 1416.65097号
[63] Y.Xi和Y.Saad,用最小二乘有理滤波器计算部分谱,SIAM J.科学。计算。,38(2016),第A3020-A3045页·Zbl 1351.65026号
[64] I.Yamazaki、Z.Bai、H.Simon、L.-W.Wang和K.Wu,厚重启Lanczos方法的自适应投影子空间维数,ACM变速器。数学。软质。,37 (2010), 27. ·Zbl 1364.65089号
[65] Y.Zhou、J.Chelikowsky和Y.Saad,求解Kohn-Sham方程的无稀疏对角化Chebyshev滤波子空间迭代法,J.计算。物理。,274(2014),第770-782页·Zbl 1351.82098号
[66] Y.Zhou、Y.Saad、M.L.Tiago和J.R.Chelikowsky,基于Chebyshev滤波子空间加速的并行自场计算,物理。修订版E(3),74(2006),066704·Zbl 1105.65111号
[67] Y.Zhou、Y.Saad、M.L.Tiago和J.R.Chelikowsky,基于切比雪夫滤波子空间迭代的自洽场计算,J.计算。物理。,219(2006),第172-184页·Zbl 1105.65111号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。