伊多尔多·迪纳波利;埃尔玛·佩斯;马库斯·赫鲁尼亚克;保罗·比伦蒂内西 FLAPW方法中哈密顿量和重叠矩阵的高效生成。 (英语) Zbl 1376.65067号 计算。物理。Commun公司。 211, 61-72 (2017). 摘要:计算科学家最大的努力之一是将描述一类物理现象的数学模型转换为大型复杂代码。这些代码中的许多都面临着在模型中实现数学运算的困难,因为低级别的优化内核提供了性能和可移植性。基于过时的性能指标(例如,最小化内存占用),传统代码受到了刚性设计选择的额外诅咒。使用材料科学社区的代表性代码,我们提出了一种方法,根据稠密线性代数(BLAS3)内核的优化组合来重构最昂贵的操作。由此产生的算法保证了该代码的性能提高和寿命延长,从而实现了更大规模的模拟。 引用于2文件 MSC公司: 65楼30 其他矩阵算法(MSC2010) 81V70型 多体理论;量子霍尔效应 65年20月 数值算法的复杂性和性能 65Z05个 科学应用 81-08 量子理论相关问题的计算方法 关键词:密度泛函理论;高性能计算;稠密线性代数;矩阵生成;性能可移植性;FLAPW方法 软件:FLEUR公司;wien-speedup公司;威恩2k;元素 PDF格式BibTeX公司 XML格式引用 \textit{E.Di Napoli}等人,计算。物理。Commun公司。211,61-72(2017年;兹bl 1376.65067) 全文: 内政部 arXiv公司 参考文献: [2] 佩斯,E。;Fabregat-Traver,D。;Bientinesi,P.,关于基于BLAS的张量收缩的性能预测,高性能计算系统,性能模型。基准模拟。,8966, 193-212 (2015) [3] 比肖夫,C。;Loan,C.V.,《户主矩阵乘积的wy表示法》,SIAM J.Sci。统计计算。,8、1、s2-s13(1987)·Zbl 0628.65033号 [4] Joffrain,T。;低,T.M。;金塔纳-奥尔蒂,E.S。;Geijn,R.v.d。;Zee,F.G.V.,《积累户主转变》,重访,ACM Trans。数学。软件,32,2,169-179(2006),URLhttp://doi.acm.org/10.1145/1141885.1141886 ·Zbl 1365.65106号 [5] 坎宁,A。;曼施塔特,W。;Freeman,A.J.,FLAPW方法的并行化,计算。物理。通信,130,3,233-243(2000)·Zbl 0956.82505号 [6] 彼得森,M。;瓦格纳,F。;赫夫纳格尔,L。;谢夫勒,M。;布拉哈,P。;Schwarz,K.,《提高FP-LAPW计算的效率》,计算。物理。通信,126,3,294-309(2000)·1040.82500兹罗提 [7] Nogueira,F。;马奎斯,M.A.L。;Fiolhais,C.,密度泛函理论入门,(物理讲义(2003),施普林格:施普林格-柏林)·兹比尔1030.00046 [8] 肖尔,D。;Steckel,J.A.(密度泛函理论,实践导论(2011),John Wiley&Sons) [9] Wimmer,E。;克拉考尔,H。;Weinert,M。;Freeman,A.J.,计算分子和表面电子结构的全势自洽线性增强平面波方法-O2分子,Phys。B版,24,2864-875(1981) [10] Jansen,H.J.F。;Freeman,A.J.,《块状固体的全能量全势线性化增强平面波方法——钨的电子和结构特性》,Phys。B版,第30、2、561-569页(1984年) [11] Burke,K.,《密度泛函理论的观点》,J.Chem。物理。,13615150901(2012年) [12] Hohenberg,P.,《非均匀电子气体》,Phys。修订版,136、3B、B864-B871(1964年) [13] 科恩,W。;Sham,L.J.,《包含交换和相关效应的自洽方程》,《物理学》。修订版,140,A1133-A1138(1965) [14] Weinert,M.,《泊松方程的解:超越Ewald-type方法》,J.Math。物理。,22, 11 (1981) [15] 阿什克罗夫特,N。;Mermin,N.,《固体物理学》,HRW国际版(1976年),霍尔特、莱因哈特和温斯顿·Zbl 1118.82001号 [16] Kurz,P.,《表面和超薄膜中的非共线磁性》(2000年),亚琛RWTH出版社,网址http://www.fz-juelich.de/pgi/pgi-1/de/Leistungen/MasterDiplomDr/node.html [17] 辛格,D.J。;Nordström,L.,《平面波、赝势和LAPW方法》(2006),施普林格:施普林格美国 [19] 那不勒斯,E.Di;Berljafa,M.,相关特征值问题序列的块迭代特征值求解器,计算。物理。Comm.,184,11,2478-2488(2013)·Zbl 1349.81016号 [20] M.Berljafa。;沃特曼,D。;Napoli,E.Di,用于特征值问题序列的优化和可扩展特征解算器,Concurr。计算:实际。有效期:27,4905-922(2014年) [21] 布拉哈,P。;Hofstätter,H。;科赫,O。;拉斯科夫斯基,R。;Schwarz,K.,电子结构计算中基于增强平面波方法的迭代对角化,J.Compute。物理。,229, 2, 453-460 (2010) ·Zbl 1183.82003年 [22] Knuth,D.E.,带go to语句的结构化编程,ACM Compute。调查。,6, 4, 261-301 (1974) ·Zbl 0301.68014号 [23] Poulson,J。;标记,B。;范德盖因,R.A。;哈蒙德,J.R。;Romero,N.A.,Elemental:分布式内存密集矩阵计算的新框架,ACM Trans。数学。软件,39,2,13:1-13:24(2013),URLhttp://doi.acm.org/10.1145/2427023.2427030 ·Zbl 1295.65137号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。