哈特维格·安兹特;特里·科让;戈兰·弗莱加;弗里茨·哥贝尔;托马斯·格吕茨马赫;普拉蒂克·纳亚克;托比亚斯·里比泽尔;蔡玉祥Mike;恩里克·金塔纳·奥尔蒂。 银杏:用于高性能计算的现代线性算子代数框架。 (英语) Zbl 07500127号 ACM事务处理。数学。柔和。 48,第1号,第2条,33页(2022年). 引用于5文件 MSC公司: 65-XX岁 数值分析 关键词:高性能计算;健康的软件生命周期;多核和多核体系结构 软件:货币基金组织;拉帕克;谷歌测试;xSDK软件包;银杏;交易.ii;ParILUT公司 PDF格式BibTeX公司 XML格式引用 \textit{H.Anzt}等人,《美国医学杂志》。数学。柔和。48,第1号,第2条,33页(2022;Zbl 07500127) 全文: DOI程序 参考文献: [1] 2020年。套房稀疏矩阵收集。检索自http://faulty.cse.tamu.edu/davis/suitesparse.html。 [2] (2020年4月访问)。混合波特兰模式库。 [3] (2020年4月访问)。对象切片。波特兰模式库。 [4] (2020年4月访问)。xSDK示例检索自https://xsdk.info/release-0-5-0/。 [5] (于2020b年4月访问)。xSDK:检索到的极端规模科学软件开发工具包https://xsdk.info/。 [6] (2018年8月访问)。更好的科学软件检索自https://bssw.io/。 [7] (2018年8月访问)。谷歌测试。检索自https://github.com/google/googletest。 [8] Alzetta,G.、Arndt,D.、Bangerth,W.、Boddu,V.、Brands,B.、Davydov,D.、Gassmoeller,R.、Heister,T.、Heltai,L.、Kormann,K.、Kronbichler,M.、Maier,M.,Pelteret,J.-P.、Turcksin,B.和Wells,D.,2018年。交易。II库,版本9.0。《数值数学杂志》26,4,(2018),173-183·Zbl 1410.65363号 [9] Anderson,E.Bai,Z,Bischof,C,Blackford,S,Demmel,J,Dongarra,J,Croz,J.Du,Greenbaum,A.,Hammarling,S,McKenney,A.,and Sorensen,D.,1999年。LAPACK用户指南。工业和应用数学学会,第三届。编辑:费城·Zbl 0934.65030号 [10] 安德森·R、安德烈·J、巴克·A、布拉姆威尔·J、卡米尔·J·S、塞维尼·J、杜布雷夫·V、杜杜伊特·Y、费希尔·A、科列夫·T、帕兹纳·W、斯托维尔·M、托莫夫·V,达姆·J、麦地那·D和扎皮尼·S。2019年。模块化有限元方法库。https://www.sciencedirect.com/science/article/abs/pii/S0898122120302583?通过 ·Zbl 1524.65001号 [11] Anzt,H.、Chen,Y.-C、Cojean,T.、Dongarra,J.、Flegar,G.、Nayak,P.、Quintana Ortí,E.S.、Tsai,Y.M.和Wang,W.。2019。走向持续基准测试:高性能软件的自动化性能评估框架。高级科学计算平台会议论文集,1-11。 [12] Anzt,H.、Chow,E.和Dongarra,J.,2015年。迭代稀疏三角求解预处理。欧洲并行处理会议记录,柏林施普林格,650-661 [13] Anzt,H.、Chow,E.和Dongarra,J.,2018年。Parilu——一种新的并行阈值ilu分解。SIAM J.科学。计算40,4,(2018)C503-C519·Zbl 1391.65055号 [14] Anzt,H.、Cojean,T.、Chen,Y.-C.、Flegar,G.、Göbel,F.、Grützmacher,T.,Nayak,P.、Ribizel,T.和Tsai,Y.-H.,2020年。银杏:高性能数值线性代数库。《开源软件杂志》,5,52(2020),2260·Zbl 07500127号 [15] Anzt,H.、Dongarra,J.、Flegar,G.、Higham,N.J.和Quintana-Orti,E.S.,2019年。迭代稀疏线性系统解算器块雅可比预处理的自适应精度。并发与计算:实践与经验31,2019年6月,e4460。 [16] Anzt,H.、Dongarra,J.、Flegar,G.和Quintana-Orti,E.S.,2019年。图形处理器上块jacobi预处理的可变大小批处理gauss-jordan消除。并行计算81,(2019),131-146。 [17] Anzt,H.、Huckle,T.K.、Bräckle,J.和Dongarra,J.,2018年。并行预处理的不完全稀疏近似逆。并行计算71,(2018),1-22。 [18] Anzt,H.、Ribizel,T.、Flegar,G.、Chow,E.和Dongarra,J.,2019年。ParILUT-GPU的并行阈值ILU。2019 IEEE国际并行和分布式处理研讨会。231-241. [19] Chow,E.、Anzt,H.和Dongarra,J.,2015年。在GPU上计算不完全分解的异步迭代算法。《高性能计算国际会议论文集》,Springer,1-16。 [20] Coplian,J.O.1995年。奇怪的重复出现的模板模式。C++报告。 [21] Deakin,T.、Price,J.、Martineau,M.和McIntosh-Smith,S.,2016年。GPU-STREAM v2.0:跨不同并行编程模型对多核处理器可实现的内存带宽进行基准测试。在Taufer,M.、Mohr,B.和Kunkel,J.M.主编的《高性能计算》(High Performance Computing),Springer。489-507. [22] Flegar,G.、Anzt,H.、Cojean,T.和Quintana-Orti,E.S.,2021年。银杏线性代数软件中用于高性能预处理的自适应精度块雅可比。ACM数学软件交易,47,2(2021),1-12·Zbl 07467974号 [23] Gamma,E.,Helm,R.,Johnson,R.和Vlisseds,J.M.,1994年。设计模式:可重用面向对象软件的元素。(第1版)。Addison Wesley专业版·Zbl 0887.68013号 [24] Goebel,F.、Anzt,H.、Cojean,T.、Flegar,G.和Quintana-Orti,E.S.,2020年。迭代三角解的多精度块jacobi。《欧洲并行处理会议记录》,施普林格,546-560。 [25] Jagode,H.、Danalis,A.、Anzt,H.和Dongarra,J.,2019年。用于深入性能分析的Papi软件定义事件。《国际高性能计算应用杂志》33,6(2019),1113-1127。 [26] Johnson,R.、Gamma,E.、Vlisseds,J.和Helm,R.,1995年。设计模式:可重用的面向对象软件的元素。艾迪森·韦斯利·Zbl 0887.68013号 [27] Lawson,C.L.、Hanson,R.J.、Kincaid,D.R.和Krogh,F.T.,1979年。fortran用法的基本线性代数子程序。《数学软件汇刊》5,3(1979),308-323·Zbl 0412.65022号 [28] Saad,Y.,2003年。稀疏线性系统的迭代方法。(工业和应用数学学会)。(第2版)·Zbl 1031.65046号 [29] Tsai,Y.M.、Cojean,T.和Anzt,H.,2020a。AMD和NVIDIA GPU上的稀疏线性代数——竞赛正在进行。《高性能计算国际会议论文集》,Springer,309-327。 [30] Tsai,Y.M.、Cojean,T.、Ribizel,T.和Anzt,H.2020b。为amd-gpus准备银杏–关于将cuda代码移植到臀部的证明。https://link.springer.com/chapter/10.1007/978-3-030-71593-9_9 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。