×

混合精度多重网格求解器的代数误差分析。 (英语) Zbl 07418113号

摘要:本文建立了第一个理论框架,用于分析舍入误差对使用混合精度迭代重定义求解器的多重网格方法的影响。虽然受离散线性椭圆偏微分方程产生的稀疏对称正定(SPD)矩阵方程的驱动,但该框架是纯代数的,因此它适用于不一定来自连续统的矩阵。基于所谓的能量或(A)范数,这是许多涉及SPD矩阵的问题的自然范数,我们提供了范数正向误差分析,并引入了多重网格求解器的渐进精度的概念。多重网格层次结构的每个级别使用三种不同的精度,每种精度都会随着级别的精细程度而增加,但速度不同,从而确保大部分计算使用尽可能低的精度。这里在能量范数中发展的理论结果在重要方面与以前基于欧几里得范数的理论有显著不同。特别地,我们表明,简单地将精确结果舍入到有限精度会导致能量范数中的误差,该误差与相关矩阵条件数\(\kappa \)的平方根成正比。(相比之下,当以欧几里德范数测量时,此误差为1阶。)鉴于此观察结果,我们表明V循环和全多重网格的极限精度在能量与(kappa^{1/2})成正比的意义上是最优的。此外,我们证明了四舍五入导致的收敛速度损失与(kappa{1/2})成比例增长,但认为这种损失在实践中是微不足道的。本文提出的理论是迭代精化能量范数中的第一个正向误差分析和多重网格的第一个舍入误差分析。

MSC公司:

65层10 线性系统的迭代数值方法
65克50 舍入误差
65M55型 多重网格方法;涉及偏微分方程的初值和初边值问题的区域分解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Ahueís和F.Chatelin,使用缺陷修正来细化紧积分算子的特征元,SIAM J.Numer。分析。,20(1983年),第1087-1093页,https://doi.org/10.1137/0720077。 ·Zbl 0528.65073号
[2] M.Arioli、J.W.Demmel和I.S.Duff,《求解具有稀疏后向误差的稀疏线性系统》,SIAM J.矩阵分析。申请。,10(1989),第165-190页,https://doi.org/10.1137/0610013。 ·Zbl 0684.65022号
[3] M.Baboulin、A.Buttari、J.Dongarra、J.Kurzak、J.Langou、J.Rangou、P.Luszczek和S.Tomov,用混合精度算法加速科学计算,计算。物理学。社区。,180(2009),第2526-2533页,https://doi.org/10.1016/j.cpc.2008.11.005。 ·兹比尔1197.65240
[4] A.Brandt和O.Livne,多重网格技术。1984年流体动力学应用指南,修订版,SIAM,费城,2011,https://doi.org/10.1137/1.9781611970753。 ·Zbl 1227.65121号
[5] W.L.Briggs、V.E.Henson和S.F.McCormick,《多重网格教程》,第二版,SIAM,费城,2000年,https://doi.org/10.1137/1.9780898719505。 ·Zbl 0958.65128号
[6] A.Buttari、J.Dongarra、J.Kurzak、P.Luszczek和S.Tomov,使用混合精度进行稀疏矩阵计算以提高性能,同时达到64位精度,ACM Trans。数学。软质。,34(2008),第17:1-17:22页,https://doi.org/10.1145/1377596.1377597。 ·Zbl 1190.65117号
[7] A.Buttari、J.Dongarra、J.Langou、J.Rangou、P.Luszczek和J.Kurzak,稠密线性系统解的混合精度迭代精化技术,国际。J.高性能计算。申请。,21(2007),第457-466页,https://doi.org/10.1177/1094342007084026。 ·兹比尔1197.65240
[8] E.Carson和N.J.Higham,《迭代求精的新分析及其在病态稀疏线性系统精确解中的应用》,SIAM J.Sci。计算。,39(2017),第A2834-A2856页,https://doi.org/10.1137/17M1122918。 ·Zbl 1379.65019号
[9] E.Carson和N.J.Higham,通过三种精度的迭代求精加速线性系统的求解,SIAM J.Sci。计算。,40(2018年),第A817-A847页,https://doi.org/10.1137/17M1140819。 ·兹比尔1453.65067
[10] M.Clark、R.Babich、K.Barros、R.Brower和C.Rebbi,在GPU上使用混合精度求解器求解晶格QCD方程组,计算。物理学。社区。,181(2010),第1517-1528页,https://doi.org/10.1016/j.cpc.2010.05.002。 ·Zbl 1215.81124号
[11] J.Demmel、Y.Hida、W.Kahan、X.S.Li、S.Mukherjee和E.J.Riedy,超精度迭代求精的误差界,ACM Trans。数学。软质。,32(2006),第325-351页,https://doi.org/10.1145/1141885.1141894。 ·Zbl 1365.65082号
[12] J.W.Demmel,应用数值线性代数,SIAM,费城,1997,https://doi.org/10.1137/1.9781611971446。 ·Zbl 0879.65017号
[13] S.Galal,节能浮点单元设计,斯坦福大学博士论文,2012年,http://purl.stanford.edu/tf297yq9849。
[14] D.Go¨ddeke,《GPU集群上PDE仿真的快速准确有限元多重网格解算器》,多特蒙德理工大学博士论文,2010年,http://hdl.handle.net/2003/27243。
[15] J.L.Gustafson,The End of Error-Unum Computing,查普曼和霍尔/CRC,2015年,https://doi.org/10.10201/9781315161532。 ·Zbl 1320.65072号
[16] J.L.Gustafson和I.Yonemoto,在自己的游戏中击败浮点:Posit算术,超级计算。Innov边境。,4(2017),第71-86页,https://doi.org/10.14529/jsfi170206。
[17] A.Haidar,S.Tomov,J.Dongarra,and N.J.Higham,《利用GPU张量核快速FP16算法加速混合精度迭代精化求解器》,《高性能计算、网络、存储和分析国际会议论文集》,SC'18,IEEE出版社,新泽西州皮斯卡塔韦,第47:1-47:11页,https://doi.org/10.109/SC.2018.00050。
[18] A.Haidar、P.Wu、S.Tomov和J.Dongarra,《研究半精度算法以加速稠密线性系统解算器》,载《第八届大型系统可缩放算法最新进展研讨会论文集》,2017年,美国计算机学会,纽约,第10:1-10:8页,https://doi.org/10.1145/3148226.3148237。
[19] N.J.Higham,《数值算法的准确性和稳定性》,第二版,SIAM,费城,2002年,https://doi.org/10.1137/1.9780898718027。 ·Zbl 1011.65010号
[20] J.Langu、J.Langou、P.Luszczek、J.Kurzak、A.Buttari和J.Dongarra,利用32位浮点算法在获得64位精度方面的性能(重新审视线性系统的迭代求精),SC'06:2006 ACM/IEEE超级计算会议论文集,2006,113-es,https://doi.org/10.1145/1188455.1188573。
[21] J.Mandel、S.McCormick和R.Bank,变分多重网格理论,多重网格方法,SIAM,费城,1987年,第131-177页,https://doi.org/10.1137/1.9781611971057.ch5。
[22] S.F.McCormick,变分问题的多重网格方法:V循环的一般理论,SIAM J.Numer。分析。,22(1985),第634-643页,https://doi.org/10.1137/0722039。 ·Zbl 0602.65038号
[23] C.B.Moler,浮点迭代求精,J.ACM,14(1967),第316-321页,https://doi.org/10.1145/321386.321394。 ·Zbl 0161.35501号
[24] A.Pedram、S.Richardson、M.Horowitz、S.Galal和S.Kvatinsky,《黑暗硅时代的黑暗内存和加速器丰富系统优化》,IEEE设计测试,34(2017),第39-50页,https://doi.org/10.109/MDAT.2016.2573586。
[25] G.Strang和G.Fix,《有限元法分析》,第二版,韦尔斯利-剑桥出版社,2008年·Zbl 1171.65081号
[26] R.Strzodka和D.Goöddeke,收敛迭代方案的混合精度方法,《2006年使用新商品架构的边缘计算研讨会论文集》,2006年,D-59-60,http://asc.ziti.uni-heidelberg.de/sites/default/files/research/papers/public/StGo06convIter.pdf。
[27] R.Tamstorf、J.Benzaken和S.F.McCormick,离散化误差精确混合精度多重网格解算器,SIAM J.Sci。计算。,(2021年),第S420-S447页,https://doi.org/10.1137/20M1349230。 ·Zbl 07378149号
[28] P.S.Vassilevski,多层块分解预处理器,Springer Verlag,纽约,2008,https://doi.org/10.1007/978-0-387-71564-3。 ·Zbl 1170.65001号
[29] J.H.Wilkinson,《自动计算引擎进展报告》,技术报告MA/17/1024,英国泰丁顿国家物理实验室科学与工业研究部数学部,1948年。
[30] J.H.Wilkinson,代数过程中的舍入误差,Prentice-Hall,Englewood Cliffs,新泽西州,1963年·Zbl 1041.65502号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。