×

银杏:用于高性能计算的现代线性算子代数框架。 (英语) Zbl 07500127号


MSC公司:

65-XX岁 数值分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 2020.Suite稀疏矩阵系列。检索自http://faculty.cse.tamu.edu/davis/suitesparse.html。
[2] (2020年4月访问)。混合波特兰模式库。
[3] (2020年4月访问)。对象切片。波特兰模式库。
[4] (2020年4月访问)。xSDK示例检索自https://xsdk.info/release-0-5-0/。
[5] (于2020b年4月访问)。xSDK:检索到的极端规模科学软件开发工具包https://xsdk.info/。
[6] (2018年8月访问)。更好的科学软件检索自https://bssw.io/。
[7] (2018年8月访问)。谷歌测试。检索自https://github.com/google/googletest。
[8] Alzetta,G.、Arndt,D.、Bangerth,W.、Boddu,V.、Brands,B.、Davydov,D.、Gassmoeller,R.、Heister,T.、Heltai,L.、Kormann,K.、Kronbichler,M.、Maier,M.,Pelteret,J.-P.、Turcksin,B.和Wells,D.,2018年。交易。II库,版本9.0。《数值数学杂志》26,4,(2018),173-183·Zbl 1410.65363号
[9] Anderson,E.Bai,Z,Bischof,C,Blackford,S,Demmel,J,Dongarra,J,Croz,J.Du,Greenbaum,A.,Hammarling,S,McKenney,A.,and Sorensen,D.,1999年。LAPACK用户指南。工业和应用数学学会,第三届。编辑:费城·Zbl 0934.65030号
[10] 安德森·R、安德烈·J、巴克·A、布拉姆威尔·J、卡米尔·J·S、塞维尼·J、杜布雷夫·V、杜杜伊特·Y、费希尔·A、科列夫·T、帕兹纳·W、斯托维尔·M、托莫夫·V,达姆·J、麦地那·D和扎皮尼·S。2019年。模块化有限元方法库。https://www.sciencedirect.com/science/article/abs/pii/S0898122120302583?通过 ·Zbl 1524.65001号
[11] Anzt,H.、Chen,Y.C.、Cojean,T.、Dongarra,J.、Flegar,G.、Nayak,P.、Quintana-Orti,E.S.、Tsai,Y.M.和Wang,W.,2019年。走向持续基准测试:高性能软件的自动化性能评估框架。高级科学计算平台会议论文集,1-11。
[12] Anzt,H.、Chow,E.和Dongarra,J.,2015年。迭代稀疏三角形解用于预处理。欧洲并行处理会议记录,柏林施普林格,650-661
[13] Anzt,H.、Chow,E.和Dongarra,J.,2018年。Parilut——一种新的并行阈值ilu因子分解。SIAM J.科学。计算40,4,(2018)C503-C519·Zbl 1391.65055号
[14] Anzt,H.、Cojean,T.、Chen,Y.-C.、Flegar,G.、Göbel,F.、Grützmacher,T.,Nayak,P.、Ribizel,T.和Tsai,Y.-H.,2020年。银杏:高性能数值线性代数库。《开源软件杂志》,5,52(2020),2260·Zbl 07500127号
[15] Anzt,H.、Dongarra,J.、Flegar,G.、Higham,N.J.和Quintana-Orti,E.S.,2019年。迭代稀疏线性系统解算器块雅可比预处理的自适应精度。并发与计算:实践与经验31,2019年6月,e4460。
[16] Anzt,H.、Dongarra,J.、Flegar,G.和Quintana-Orti,E.S.,2019年。图形处理器上块jacobi预处理的可变大小批处理gauss-jordan消除。并行计算81,(2019),131-146。
[17] Anzt,H.、Huckle,T.K.、Bräckle,J.和Dongarra,J.,2018年。并行预处理的不完全稀疏近似逆。并行计算71,(2018),1-22。
[18] Anzt,H.、Ribizel,T.、Flegar,G.、Chow,E.和Dongarra,J.,2019年。ParILUT-GPU的并行阈值ILU。2019 IEEE国际并行和分布式处理研讨会。231-241.
[19] Chow,E.、Anzt,H.和Dongarra,J.,2015年。在GPU上计算不完全分解的异步迭代算法。《高性能计算国际会议论文集》,Springer,1-16。
[20] Coplian,J.O.1995年。奇怪的重复出现的模板模式。C++报告。
[21] Deakin,T.、Price,J.、Martineau,M.和McIntosh-Smith,S.,2016年。GPU-STREAM v2.0:跨不同并行编程模型对多核处理器可实现的内存带宽进行基准测试。在Taufer,M.、Mohr,B.和Kunkel,J.M.主编的《高性能计算》(High Performance Computing),Springer。489-507.
[22] Flegar,G.、Anzt,H.、Cojean,T.和Quintana-Orti,E.S.,2021年。用于银杏线性代数软件中高性能预处理的自适应精确块雅可比。ACM数学软件交易,47,2(2021),1-12·Zbl 07467974号
[23] Gamma,E.,Helm,R.,Johnson,R.和Vlisseds,J.M.,1994年。设计模式:可重用的面向对象软件的元素。(第1版)。Addison-Wesley Professional公司·Zbl 0887.68013号
[24] Goebel,F.、Anzt,H.、Cojean,T.、Flegar,G.和Quintana Ortí,E.S.,2020年。用于迭代三角形求解的多精度块雅可比。《欧洲并行处理会议记录》,施普林格,546-560。
[25] Jagode,H.、Danalis,A.、Anzt,H.和Dongarra,J.,2019年。用于深入性能分析的Papi软件定义事件。《国际高性能计算应用杂志》33,6(2019),1113-1127。
[26] Johnson,R.、Gamma,E.、Vlisseds,J.和Helm,R.,1995年。设计模式:可重用面向对象软件的元素。艾迪森·韦斯利·Zbl 0887.68013号
[27] Lawson,C.L.、Hanson,R.J.、Kincaid,D.R.和Krogh,F.T.,1979年。fortran用法的基本线性代数子程序。《数学软件汇刊》5,3(1979),308-323·Zbl 0412.65022号
[28] Saad,Y.,2003年。稀疏线性系统的迭代方法。(工业和应用数学学会)。(第2版)·Zbl 1031.65046号
[29] Tsai,Y.M.、Cojean,T.和Anzt,H.,2020a。AMD和NVIDIA GPU上的稀疏线性代数——竞赛正在进行。《高性能计算国际会议论文集》,Springer,309-327。
[30] Tsai,Y.M.、Cojean,T.、Ribizel,T.和Anzt,H.2020b。为amd-gpus准备银杏–关于将cuda代码移植到臀部的证明。https://link.springer.com/chapter/10.1007/978-3-030-71593-9_9
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。