×

具有可调无穷范数条件数且在LU因式分解中不需要枢轴的矩阵。 (英语) Zbl 1467.65035号

摘要:我们提出了一类非对称稠密(n次n)矩阵(a(α,β))的双参数族,对于该族,不带枢轴的LU因子分解在数值上是稳定的,并且我们展示了如何选择α和β来获得范数的任意值。矩阵(A(α,β))可以由(O(n^2))触发器中的一个简单公式构成。该矩阵适用于HPL-AI混合精度基准测试,该基准测试需要一个极端规模的测试矩阵(维数(n>10^7)),该矩阵具有受控的条件数,可以安全地用于LU分解,而无需旋转。作为通用测试矩阵,它也很有趣。

MSC公司:

65层35 矩阵范数、条件、缩放的数值计算
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.H.Ahlberg和E.N.Nilson,花键拟合的收敛性,工业社会杂志。申请。数学。,11(1963年),第95-104页,https://doi.org/10.1137/0111007。 ·Zbl 0196.48701号
[2] R·P·布伦特(R.P.Brent),一种保证收敛的求函数零点的算法,计算。J.,14(1971),第422-425页,https://doi.org/10.1093/comjnl/14.4422。 ·Zbl 0231.65046号
[3] J.C.P.Bus和T.J.Dekker,寻找函数零点的两种保证收敛的有效算法,ACM Trans。数学。软件,1(1975),第330-345页,https://doi.org/10.1145/355656.355659。 ·兹伯利0315.65031
[4] E.Carson和N.J.Higham,通过三种精度的迭代求精加速线性系统的求解,SIAM J.Sci。计算。,40(2018),第A817-A847页,https://doi.org/10.1137/17M1140819。 ·Zbl 1453.65067号
[5] T.A.Davis和Y.Hu,佛罗里达大学稀疏矩阵收集,ACM Trans。数学。软件,38(2011),1,https://doi.org/10.1145/2049662.2049663。 ·Zbl 1365.65123号
[6] J.W.Demmel,关于条件数和到最近的病态问题的距离,Numer。数学。,51(1987),第251-289页,https://doi.org/10.1007/BF01400115。 ·Zbl 0597.65036号
[7] J.W.Demmel和A.McKenney,测试矩阵生成套件,预打印MCS-P69-0389,LAPACK工作注释9,阿尔贡国家实验室数学和计算机科学部,伊利诺伊州阿尔贡,1989年,https://doi.org/10.2172/7284674。
[8] J.Dongarra、M.A.Heroux和P.Luszczek,《高性能共轭梯度基准:高性能计算系统排名的新指标》,《国际高性能计算应用》,30(2016),第3-10页,https://doi.org/10.1177/1094342015593158。
[9] J.Dongarra、M.A.Heroux和P.Luszczek,《高性能计算系统排名的新指标》,Natl。科学。第3版(2016年),第30-35页,https://doi.org/10.1093/nsr/nwv084。
[10] J.J.Dongarra、P.Luszczek和A.Petitet,LINPACK基准:过去、现在和未来,并发计算。实践。专家。,15(2003),第803-820页,https://doi.org/10.1002/cpe.728。
[11] I.S.Duff、R.G.Grimes和J.G.Lewis,稀疏矩阵测试问题,ACM Trans。数学。软件,15(1989),第1-14页,https://doi.org/10.1145/62038.62043。 ·兹比尔0667.65040
[12] M.Fasi和N.J.Higham,用指定的奇异值或条件数生成极值矩阵,SIAM J.Sci。计算。,43(2021),第A663-A684页,https://doi.org/10.1137/20M1327938。 ·Zbl 1462.65041号
[13] M.Galassi、J.Davies、J.Theiler、B.Gough、G.Jungman、P.Alken、M.Booth和F.Rossi,GNU科学图书馆参考手册,第三版,网络理论,2009年。
[14] D.J.Higham,条件数及其条件数,线性代数应用。,214(1995),第193-213页,https://doi.org/10.1016/0024-3795(93)00066-9. ·Zbl 0816.15004号
[15] N.J.Higham,算法694:MATLAB中的测试矩阵集合,ACM Trans。数学。《软件》,17(1991),第289-305页,https://doi.org/10.1145/114697.116805。 ·Zbl 0900.65120号
[16] N.J.Higham,《数值算法的准确性和稳定性》,第二版,SIAM,宾夕法尼亚州费城,2002年,https://doi.org/10.1137/1.9780898718027。 ·兹比尔1011.65010
[17] N.J.Higham,《标准和基于GMRES的二精度和三精度迭代精化的误差分析》,MIMS EPrint 2019.19,英国曼彻斯特大学曼彻斯特数学科学研究所,2019年,http://eprints.mathems.manchester.ac.uk/2735/。
[18] N.J.Higham和T.Mary,概率舍入误差分析的新方法,SIAM J.Sci。计算。,41(2019),第A2815-A2835页,https://doi.org/10.1137/18M1226312。 ·Zbl 07123205号
[19] N.J.Higham、S.Pranesh和M.Zounon,将矩阵压缩为半精度,并应用于求解线性系统,SIAM J.Sci。计算。,41(2019),第A2536-A2551页,https://doi.org/10.1137/18M1229511。 ·Zbl 1420.65017号
[20] 电气与电子工程师协会,IEEE浮点运算标准,IEEE Std 754-2019(IEEE Std 754-2008修订版),电气与电子工程协会,新泽西州皮斯卡塔韦,2019年,https://doi.org/10.109/IEEESTD.2019.8766229。
[21] Intel Corporation,BFLOAT16-Hardware Numerics Definition,白皮书,文档338302-001US,2018,https://software.intel.com/en-us/download/bfloat16-hardware-numerics-definition。
[22] S.Kudo、K.Nitadori、T.Ina和T.Imamura,Fugaku上一个EFlop/S HPL-AI基准的实现和数值技术,第11届IEEE/ACM研讨会论文集,关于大规模可伸缩算法的最新进展,2020年,第69-76页,https://doi.ieecomputersociety.org/10.1109/ScalA51936.2020.00014。
[23] O.Lawlor、H.Govind、I.Dooley、M.Breitenfeld和L.Kale,存在低于正常浮点值时的性能退化,《高性能应用中操作系统干扰国际研讨会论文集》,2005年,https://charm.cs.illinois.edu/newPapers/05-12/paper.pdf。
[24] P.Luszczek、J.J.Dongarra、D.Koester、R.Rabenseifner、B.Lucas、J.Kepner、J.McCalpin、D.Bailey和D.Takahashi,《HPC挑战基准套件简介》,技术报告ICL-UT-05-01,田纳西大学创新计算实验室,https://www.icl.utk.edu/files/publications/2005/icl-utk-223-2005.pdf。
[25] V.Marjanovicí,J.Gracia和C.W.Glass,《HPCG基准的性能建模》,载于《高性能计算系统:性能建模、基准和仿真》,Springer,Cham,2015年,第172-192页,https://doi.org/10.1007/978-3-319-17248-4_9。
[26] C.B.Moler,新HPL-AI基准矩阵,https://blogs.mathworks.com/cleve/2019/12/04/a-matrix-for-the-new-hpl-ai-benchmark/, 2019.
[27] MPI论坛,MPI:消息传递接口标准,第3.1版,斯图加特高性能计算中心(HLRS),2015,https://www.mpi-forum.org/docs/mpi-3.1/mpi31-report.pdf。
[28] J.-M Muller、N.Brunie、F.de Dinechin、C.-P.Jeannerod、M.Joldes、V.Lefèvre、G.Melquiond、N.Revol和S.Torres,《浮点运算手册》,第二版,Birkha \768]用户,Cham,2018年,https://doi.org/10.1007/978-3-319-76526-6。 ·Zbl 1394.65001号
[29] A.M.Ostrowski,《关于单参数矩阵族的谱》,J.Reine Angew。数学。,193(1954),第143-160页,https://doi.org/10.1515/crll.1954.193.143。 ·Zbl 0058.25303号
[30] A.Petitet、R.C.Whaley、J.Dongarra和A.Cleary,HPL:分布式内存计算机高性能Linpack基准的可移植实现,2.3版,2018年,https://www.netlib.org/bequickment/hpl/。
[31] E.M.Schwarz、M.Schmookler和S.D.Trong,非规范化数字的FPU实现,IEEE Trans。计算。,54(2005),第825-836页,https://doi.org/10.109/tc.2005.118。
[32] G.W.Stewart,《关于LU和Cholesky因子的扰动》,IMA J.Numer。分析。,17(1997),第1-6页,https://doi.org/10.1093/imanum/17.1.1。 ·兹伯利0876.65016
[33] J.Sun,一些矩阵分解的分量扰动界,BIT,32(1992),第702-714页,https://doi.org/10.1007/BF01994852。 ·Zbl 0764.65016号
[34] J.M.Varah,矩阵最小奇异值的下界,线性代数应用。,11(1975年),第3-5页,https://doi.org/10.1016/0024-3795(75)90112-3. ·Zbl 0312.65028号
[35] J.H.Wilkinson,矩阵反演直接方法的误差分析,J.Assoc.Compute。机器。,8(1961年),第281-330页,https://doi.org/10.1145/321075.321076。 ·Zbl 0109.09005号
[36] W.Zhang和N.J.Higham,Matrix Depot:针对Julia的可扩展测试矩阵集合,PeerJ Compute。科学。,2(2016),e58,https://doi.org/10.7717/peerj-cs.58。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。