×

Cucheb:过滤Lanczos程序的GPU实现。 (英语) Zbl 1411.65005号

摘要:本文描述了软件包Cucheb,一个GPU实现的滤波Lanczos程序,用于解决大型稀疏对称特征值问题。在计算期望区间内的特征值时,滤波Lanczos程序使用精心选择的多项式谱变换来加速Lanczos方法的收敛。该方法已被证明对电子结构计算和密度泛函理论中出现的特征值问题特别有效。我们将我们的实现与等效的CPU实现进行了比较,并表明使用GPU可以将计算时间减少10倍以上。

MSC公司:

65-04 与数值分析有关的问题的软件、源代码等
2015财年65 矩阵特征值和特征向量的数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 方,H。;Saad,Y.,SIAM J.科学。计算。,34,A2220-A2246(2012)·Zbl 1253.65053号
[2] 兰佐斯,C.,J.Res.Natl。伯尔。支架。,45255-282(1950年)
[3] 斯科菲尔德,G。;切里科夫斯基,J.R。;Saad,Y.,计算。物理。Comm.,183,497-505(2012)·Zbl 1264.82014年
[4] 周瑜,J.计算。物理。,229, 24, 9188-9200 (2010) ·Zbl 1203.65077号
[5] 周,Y。;Saad,Y.,SIAM J.矩阵分析。申请。,29, 3, 954-971 (2007) ·Zbl 1151.65321号
[6] 周,Y。;萨阿德,Y。;蒂亚戈,M.L。;Chelikowsky,J.R.,J.计算。物理。,219, 1, 172-184 (2006) ·Zbl 1105.65111号
[7] 萨阿德,Y。;Stathopoulos,A。;J.切利科夫斯基。;Wu,K。;奥古特,S.,BIT,36,3,563-578(1996)·Zbl 0862.65059号
[8] Hohenberg,P。;Kohn,W.和Phys。版本136,B864-B871(1964)
[9] 科恩,W。;Sham,L.J.,《物理学》。修订版,140,A1133-A1138(1965)
[10] 切里科夫斯基,J.R。;萨阿德,Y。;Vasiliev,I.,(时间依赖密度泛函理论。时间依赖密度函数理论,物理学讲稿,第706卷(2006),斯普林格·弗拉格:斯普林格尔·弗拉格柏林,海德堡),259-269,(第17章)
[11] 伯迪克·W·R。;萨阿德,Y。;Kronik,L。;Jain,M。;Chelikowsky,J.R.,《计算》。物理。Comm.,156,22-42(2003)
[12] Kalantzis,V.,内部特征值问题过滤Lanczos算法的GPU实现(2015)
[13] Aurentz,J.L.,《GPU加速多项式谱变换方法》(博士论文)(2014),华盛顿州立大学
[14] Wu,K。;Simon,H.,SIAM J.矩阵分析。申请。,22, 2, 602-616 (2000) ·Zbl 0969.65030号
[15] 巴格拉马,J。;Calvetti,D。;Reichel,L.,SIAM J.科学。计算。,24, 5, 1650-1677 (2003) ·Zbl 1044.65027号
[16] Calvetti,D。;赖切尔,L。;索伦森,哥伦比亚特区,电子。变速器。数字。分析。,2, 1, 21 (1994) ·Zbl 0809.65030号
[17] 库卢姆,J。;Donath,W.E.,(决策和控制,包括第13届自适应过程研讨会,1974年IEEE会议(1974年),IEEE),505-509
[18] Paige,C.C.,《超大稀疏矩阵的特征值和特征向量的计算》(博士论文)(1971年),伦敦大学
[19] D.C.Sorensen,《大规模特征值计算的隐式重启Arnoldi/Lanczos方法》,技术代表,1996年。;D.C.Sorensen,《大规模特征值计算的隐式重启Arnoldi/Lanczos方法》,技术代表,1996年·兹伯利0865.65019
[20] 比蒂,C.A。;恩布里,M。;Sorensen,D.C.,SIAM Rev.,47,3,492-515(2005)·兹比尔1073.65028
[21] Lehoucq,R.B.,《隐式重启Arnoldi迭代的分析与实现》(博士论文)(1995年),莱斯大学
[22] Saad,Y.,SIAM J.数字。分析。,17, 5, 687-706 (1980) ·Zbl 0456.65016号
[23] Simon,H.D.,数学。公司。,42, 165, 115-142 (1984) ·Zbl 0546.65017号
[24] Saad,Y.,《大型特征值问题的数值方法》(2011),SIAM:美国宾夕法尼亚州费城SIAM·兹比尔1242.65068
[25] Watkins,D.S.,矩阵特征值问题:\(G R\)和Krylov子空间方法(2007),SIAM:SIAM美国宾夕法尼亚州费城·Zbl 1142.65038号
[26] Bekas,C。;Kokiopoulou,E。;Saad,Y.,SIAM J.矩阵分析。申请。,30, 1, 397-418 (2008) ·Zbl 1159.65319号
[27] Jay,L.O。;Kim,H。;萨阿德,Y。;Chelikowsky,J.R.,《计算》。物理。Comm.,118,1,21-30(1999)·Zbl 1001.65038号
[28] 李,R。;Xi,Y。;Vecharynski,E。;杨,C。;Saad,Y.,SIAM J.科学。计算。,38,A2512-A2534(2016)·Zbl 1348.65071号
[29] Saad,Y.,SIAM J.矩阵分析。申请。,28, 3, 845-870 (2006) ·Zbl 1120.65046号
[30] 西尔弗,R.N。;罗德,H。;Voter,A.F。;Kress,J.D.,J.计算。物理。,124, 1, 115-130 (1996) ·Zbl 0863.65080号
[31] 魏(A.)。;Wellein,G。;Alvermann,A。;Fehske,H.,《现代物理学》。,78, 1, 275 (2006) ·兹比尔1205.81090
[32] Jackson,D.,《近似理论》,第11卷(1930年),学术讨论会出版物,AMS:学术讨论会出版,美国纽约州AMS
[33] Clenshaw,C.W.,数学。标签Wash.,9,118-120(1955)·Zbl 0065.05403号
[34] Corporation,N.,NVIDIA CUDA C编程指南(2015)
[35] J.L.Aurentz、V.Kalantzis、Y.Saad、Cucheb,2016年。https://github.com/jaurentz/cuchebJ.L.Aurentz、V.Kalantzis、Y.Saad、Cucheb,2016年。https://github.com/jaurentz/cucheb
[36] Nickolls,J。;巴克,I。;加兰,M。;Skadron,K.,Queue,6,2,40-53(2008)
[37] Boisvert,R.F。;波佐,R。;雷明顿,K。;巴雷特,R.F。;Dongarra,J.J.,(IFIP TC2/WG25数值软件质量工作会议记录:评估和增强(1997),查普曼和霍尔有限公司:英国伦敦查普曼与霍尔有限公司),125-137
[38] Davis,T.A。;Hu,Y.,ACM事务。数学。软件,38,1,1-25(2011)·Zbl 1365.65123号
[39] Reguly,I。;Giles,M.(创新并行计算(2012),IEEE),1-12
[40] N.Bell,M.Garland,SC'09:程序。2009年高性能计算网络、存储和分析会议。;N.Bell,M.Garland,SC'09:程序。2009年高性能计算网络、存储和分析会议。
[41] Corporation,N.,CUSPARSE图书馆用户指南(2015)
[42] Arnoldi,W.E.,夸脱。申请。数学。,9, 1, 17-29 (1951) ·Zbl 0042.12801号
[43] Parlett,B.N.,《对称特征值问题》(1980),SIAM:美国宾夕法尼亚州费城SIAM·Zbl 0431.65017
[44] Corporation,N.,CUBLAS图书馆用户指南(2015)
[45] 巴雷特,B.N。;Scott,D.S.,数学。公司。,33, 145, 217-238 (1979) ·Zbl 0405.65015号
[46] Simon,H.D.,线性代数应用。,61, 101-131 (1984) ·兹比尔0579.65030
[47] Kronik,L。;Makmal,A。;蒂亚戈,M.L。;Alemany,M.M.G。;Jain,M。;黄,X。;萨阿德,Y。;Chelikowsky,J.R.,物理学。Solidi状态b,243,5,1063-1079(2006)
[48] 卡兰齐斯,V。;Kestyn,J。;波利齐,E。;Saad,Y.,对称特征值问题的区域分解轮廓积分方法(2016)
[49] 卡兰齐斯,V。;李,R。;Saad,Y.,电子。变速器。数字。分析。,45, 305-329 (2016) ·Zbl 1352.65118号
[50] Xi,Y。;Saad,Y.,SIAM科学杂志。计算。,38,A3020-A3045(2016)·Zbl 1351.65026号
[51] M.Berljafa。;沃特曼,D。;Di Napoli,E.,协和。计算。,27, 4, 905-922 (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。