×

单尺度和多尺度微分方程的混合精度显式稳定Runge-Kutta方法。 (英文) Zbl 07540376号

摘要:混合精度算法结合了低精度和高精度计算,以便在不牺牲精度的情况下从降低精度的性能增益中获益。在这项工作中,我们设计了混合精度Runge-Kutta-Chebyshev(RKC)方法,其中高精度用于精度,低精度用于稳定性。一般来说,RKC方法是一种低阶显式格式,其稳定域随函数求值次数二次增长。因此,大多数计算工作都是为了稳定性而非准确性。在本文中,我们证明了任何Runge-Kutta格式的幼稚混合判决实现都会破坏该方法的收敛阶并限制其精度,并且我们引入了一类新的混合判决RKC格式,它们不受这种限制行为的影响。我们提出了三种混合决策方案:一种一阶和二阶RKC方法,以及一种用于多尺度问题的一阶多速率RKC方案。这些方案仅在高精度下执行精度所需的少量功能评估(一阶和二阶方法分别为1或2),而其他方案则在低精度下执行。我们证明,虽然这些方法本质上与完全低精度等效方法一样便宜,但它们保持了高精度等效方法的稳定性和收敛阶。事实上,数值实验证实,这些方案与相应的高精度方法一样准确。

MSC公司:

65磅 常微分方程的数值方法
65传真 数值线性代数
6500万 偏微分方程、初值和含时初边值问题的数值方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿卜杜勒法塔赫,A。;Anzt,H。;Boman,E.G。;Carson,E。;Cojean,T。;Dongarra,J。;福克斯,A。;盖茨,M。;新泽西州海姆。;Li,X.S.,《利用混合决策算法的数值线性代数方法综述》,《国际高性能计算》。申请。,35, 344-369 (2021)
[2] Abdulle,A.,具有递推关系的四阶Chebyshev方法,SIAM J.Sci。计算。,23, 2041-2054 (2002) ·Zbl 1009.65048号
[3] 阿卜杜勒。;阿尔穆斯利马尼,I。;Vilmart,G.,刚性和遍历随机微分方程的弱一阶最优显式稳定积分器,SIAM J.不确定性。量化。,6, 937-964 (2018) ·Zbl 1392.65013号
[4] 阿卜杜尔,A。;格罗特,M.J。;Rosilho de Souza,G.,刚性微分方程的显式稳定多速率方法,数学。计算。(2022),正在出版·Zbl 1500.65034号
[5] 阿卜杜勒。;Li,T.,S-ROCK方法用于刚性ItóSDE,Commun。数学。科学。,6, 845-868 (2008) ·Zbl 1162.60330号
[6] 阿卜杜勒。;Medovikov,A.A.,基于正交多项式的二阶切比雪夫方法,数值。数学。,2001年1月18日至18日·Zbl 0997.65094号
[7] 阿卜杜勒。;Rosilho de Souza,G.,刚性随机微分方程的显式稳定多速率方法,SIAM J.Sci。计算。(2022),正在出版·Zbl 1491.60115号
[8] 阿卜杜勒。;维尔马特,G。;Zygalakis,K.C.,刚性随机微分方程的弱二阶显式稳定方法,SIAM J.Sci。计算。,35,A1792-A1814(2013)·兹比尔1281.65005
[9] Ackmann,J。;杜本,P.D。;Palmer,T.N。;Smolarkiewicz,P.K.,全球地球物理流中线性解算器的混合精度(2021),arXiv预印本
[10] 阿古洛,E。;Cappello,F。;Di,S。;Giraud,L。;X·梁。;Schenkels,N.,《通过数字线性代数中的有损压缩技术探索可变精度存储:柔性GMRES的首次应用》(2020年),Inria Bordeaux Sud-Ouest博士论文
[11] Almuslimani,I.,对流扩散反应问题的完全自适应显式稳定积分器(2022)
[12] P.Amestoy,O.Boiteau,A.Buttari,M.Gerest,F.Jézéquel,J.Y.l'Excellent,T.Mary,2021,混合精度低阶近似及其在块低阶lu因式分解中的应用。
[13] P.Amestoy,A.Buttari,N.J.Higham,J.Y.l’Excellent,T.Mary,B.Vieuble,2021,基于GMRES的五精度迭代求精。
[14] 巴莱,S。;Abhyankar,S。;亚当斯,M。;Brown,J。;布鲁纳,P.R。;Buschelman,K。;埃伊霍特,V。;格罗普,W。;考希克,D。;Knepley,M.G.,PETSc用户手册第3.8版(2017年),阿贡国家实验室(ANL),技术报告
[15] 比约克,澳大利亚。;Paige,C.C.,《修正Gram-Schmidt算法中正交性的丢失和重新获得》,SIAM J.矩阵分析。申请。,13, 176-190 (1992) ·Zbl 0747.65026号
[16] 布兰查德,P。;新泽西州海姆。;Lopez,F。;玛丽·T。;Pranesh,S.,《混合精度块融合乘法加法:误差分析及在GPU张量核中的应用》,SIAM J.Sci。计算。,42、C124-C141(2020)·Zbl 1452.65425号
[17] Briggs,W.L。;亨森,V.E。;McCormick,S.F.,《多重网格教程》(2000),SIAM·Zbl 0958.65128号
[18] 伯内特,B。;哥特利布,S。;格兰特,Z.J。;Heryudono,A.,混合精度龙格-库塔方法的性能评估(2021)
[19] Carle,C。;Hochbruck,M。;Sturm,A.,《关于跨越式切比雪夫方案》,SIAM J.Numer。分析。,58, 2404-2433 (2020) ·Zbl 1454.65046号
[20] Carson,E。;Higham,N.J.,《迭代求精的新分析及其在病态稀疏线性系统精确解中的应用》,SIAM J.Sci。计算。,39,A2834-A2856(2017)·Zbl 1379.65019号
[21] 卡森,E。;Higham,N.J.,通过三种精度的迭代求精加速线性系统的求解,SIAM J.Sci。计算。,40,A817-A847(2018)·Zbl 1453.65067号
[22] 康诺利,M.P。;新泽西州海姆。;Mary,T.,《随机取整及其概率向后误差分析》(2020),曼彻斯特大学:曼彻斯特学院,技术报告
[23] Croci,M.,Libchopping–C++和Python中的并行低精度仿真器(2019)
[24] 克罗齐,M。;法西,M。;新泽西州海姆。;玛丽,T。;Mikaitis,M.,《随机取整:实现、错误分析和应用》,R.Soc.开放科学。,9,第211631条pp.(2021)
[25] 克罗齐,M。;Giles,M.B.,《低精度热量方程数值解中的舍入到最近和随机舍入的影响》(2020年),技术报告
[26] 达斯,D。;梅伦普迪,N。;Mudigere,D。;卡拉姆卡尔,D。;Avancha,S。;Banerjee,K。;Sridharan,S。;Vaidyanathan,K。;考尔,B。;Georganas,E.,使用整数运算的卷积神经网络的混合精度训练(2018),arXiv预印本
[27] Dembo,R.S。;艾森斯塔特,S.C。;Steihaug,T.,不精确牛顿方法,SIAM J.Numer。分析。,19, 400-408 (1982) ·Zbl 0478.65030号
[28] 杜本,P.D。;Subramanian,A。;道森,A。;Palmer,T.,《使用OpenIFS模型中的硬件模拟器降低数值精度以使超参数化更具竞争力的研究》,J.Adv.model。地球系统。,9, 566-584 (2017)
[29] 杜蒙特,T。;杜阿尔特,M。;Descombes,S。;Dronne,医学硕士。;Massot,M。;Louvet,V.,在逼真的3D几何中模拟人类缺血性中风,Commun。非线性科学。数字。模拟。,18, 1539-1557 (2013) ·Zbl 1322.92019年
[30] R·D·法尔古特。;Yang,U.M.,Hypre:高性能预处理程序库,(国际计算科学会议(2002),Springer),632-641·Zbl 1056.65046号
[31] Grant,Z.J.,混合精度应用的扰动Runge-Kutta方法(2020年)
[32] 格拉顿,S。;西蒙,E。;Titley-Peroquin,D。;Toint,P.,《利用GMRES中的可变精度》(2019),arXiv预印本
[33] Griewank,A.公司。;Walther,A.,《评估衍生品:算法区分的原理和技术》(2008),SIAM·Zbl 1159.65026号
[34] 格罗特,M.J。;米歇尔,S。;Sauter,S.A.,波动方程的基于稳定蛙跳的局部时间步进方法,数学。计算。,90, 2603-2643 (2021) ·Zbl 1493.65151号
[35] 海尔,E。;麦克拉克伦,R.I。;Razakarivony,A.,用隐式Runge-Kutta方法实现Brouwer定律,BIT-Numer。数学。,48, 231-243 (2008) ·Zbl 1148.65058号
[36] 海尔,E。;Nörsett,S.P。;Wanner,G.,解常微分方程I,计算数学中的Springer级数,第8卷(2008),Springer-Verlag:Springer-Verlag Berlin
[37] 海尔,E。;Wanner,G.,《求解常微分方程II》,第14卷(1996),柏林-海德堡出版社·兹比尔0859.65067
[38] 哈里斯,C.R。;Millman,K.J.,《使用NumPy进行数组编程》,《自然》,585,357-362(2020)
[39] Henrici,P.,《常微分方程中的离散变量方法》(1962),John Wiley&Sons,Inc·Zbl 0112.34901号
[40] Henrici,P.,《差分方法中的误差传播》(1963),John Wiley&Sons,Inc·Zbl 0171.36104号
[41] Higham,N.J.,浮点求和的准确性,SIAM J.Sci。计算。,14, 783-799 (1993) ·Zbl 0788.65053号
[42] Higham,N.J.,《数值算法的准确性和稳定性》(2002),SIAM·Zbl 1011.65010号
[43] 新泽西州海姆。;Mary,T.,概率取整误差分析的新方法,SIAM J.Sci。计算。,41, 2815-2835 (2019) ·Zbl 07123205号
[44] 新泽西州海姆。;Pranesh,S.,《模拟低精度浮点运算》,SIAM J.Sci。计算。,41,C585-C602(2019)·Zbl 07124603号
[45] 新泽西州海姆。;Pranesh,S。;Zounon,M.,《将矩阵压缩为半精度,并应用于求解线性系统》,SIAM J.Sci。计算。,41,A2536-A2551(2019)·Zbl 1420.65017号
[46] Klöwer先生。;杜本,P。;Palmer,T.,用浅水模型J.Adv.模型分析天气和气候建模中16位算术的数字格式、误差缓解和范围。地球系统。,12,文章e2020 MS002246 pp.(2020)
[47] 克洛沃,M。;哈特菲尔德,S。;克罗齐,M。;杜本,P.D。;Palmer,T.N.,流体模拟用16位加速:通过将ShallowWaters.jl压缩到Float16,J.Adv.Model,在A64FX上接近4倍加速。地球系统。,14,文章e2021MS002684 pp.(2022)
[48] 兰格,M。;Rump,S.M.,应用于浮点求和的实数求和的误差估计,BIT Numer。数学。,57, 927-941 (2017) ·Zbl 1380.65083号
[49] Lebedev,V.I.,《如何用显式方法求解刚性微分方程组》(Numer.methods Appl.(1994),CRC:CRC Boca Raton,FL),45-80·Zbl 0851.65052号
[50] 列别捷夫,V.I。;Medovikov,A.A.,《刚性常微分方程组解的二阶显式方法》,俄罗斯科学院。科学。(1994年)
[51] Lindberg,B.,IMPEX:求解刚性微分方程组的程序包(1972年),皇家理工学院信息处理系:斯德哥尔摩皇家理工学院信息处理系,技术报告
[52] Logg,A。;Mardal,K.A。;Wells,G.,《用有限元方法自动求解微分方程:FEniCS手册》,第84卷(2012),Springer Science&Business Media·Zbl 1247.65105号
[53] Lopez,F。;Mary,T.,GPU张量核上的混合精度LU因子分解:减少数据移动和内存占用(2020年),曼彻斯特大学,技术报告
[54] McCormick,S.F。;Benzaken,J。;Tamstorf,R.,混合精度多重网格求解器的代数误差分析,SIAM J.Sci。计算。,S392-S419(2021年)·Zbl 07418113号
[55] Medovikov,A.A.,抛物方程的高阶显式方法,BIT Numer。数学。,38, 372-390 (1998) ·Zbl 0909.65060号
[56] 梅伦普迪,N。;Srinivasan,S。;达斯,D。;Kaul,B.,带8位浮点的混合精度训练(2019),arXiv预打印
[57] Meurant,G。;斯特拉科什,Z.,有限精度算法中的Lanczos和共轭梯度算法,Acta Numer。,15, 471-542 (2006) ·Zbl 1113.65032号
[58] 梅耶,C.D。;Balsara,D.S。;Aslam,T.D.,抛物型和混合型方程显式超时间步长的稳定Runge-Kutta-Legendre方法,J.Compute。物理。,257594-626(2014)·Zbl 1349.65520号
[59] Micikevicius,P。;Narang,S。;Alben,J。;Diamos,G。;Elsen,E。;加西亚,D。;金斯堡,B。;休斯顿,M。;Kuchaiev,O。;Venkatesh,G.,《混合精度训练》(2017),arXiv预印本
[60] 宾夕法尼亚州帕克斯顿。;Chantry,M。;克洛沃,M。;萨芬,L。;Palmer,T.,《低精度气候建模:确定性和随机取整的影响》(2021年),arXiv预印本
[61] Rosilho de Souza,G.,通过投影方法和微分代数方法将稳定的显式Runge-Kutta方法应用于不可压缩Navier-Stokes方程(2014),EPFL,硕士论文
[62] Sommeijer,B.P。;Shampine,L。;Verwer,J.G.,《RKC:抛物线偏微分方程的显式解算器》,J.Compute。申请。数学。,88, 315-326 (1998) ·Zbl 0910.65067号
[63] Tamstorf,R。;Benzaken,J。;McCormick,S.F.,离散误差精确混合精度多重网格解算器,SIAM J.Sci。计算。,S420-S447(2021)·Zbl 07418114号
[64] 唐,X。;Xiao,A.,改进的Runge-Kutta-Chebyshev方法,数学。计算。模拟。,174, 59-75 (2020) ·Zbl 1453.65168号
[65] Tisseur,F.,浮点算法中的牛顿方法和广义特征值问题的迭代求精,SIAM J.矩阵分析。申请。,22, 1038-1057 (2001) ·Zbl 0982.65040号
[66] 范德胡温,P.J。;Sommeijer,B.P.,《关于大m值显式m阶段Runge-Kutta方法的内部稳定性》,Z.Angew。数学。机械。,60, 479-485 (1980) ·Zbl 0455.65052号
[67] Váňa,F。;杜本,P。;朗·S。;Palmer,T。;Leutbecher,M。;鲑鱼,D。;Carver,G.,《天气预报模型的单精度:与IFS的评估》,周一。《天气评论》,145495-502(2017)
[68] Verwer,J.G.,抛物方程时间积分的一类稳定显式方法的实现,ACM Trans。数学。软质。,188-205年6月(1980年)·Zbl 0431.65069号
[69] Verwer,J.G.,关于Runge-Kutta-Chebyshev方法的注释,Z.Angew。数学。机械。,62, 561-563 (1982) ·Zbl 0531.65040号
[70] Verwer,J.G.,抛物型偏微分方程的显式Runge-Kutta方法,应用。数字。数学。,22, 359-379 (1996) ·Zbl 0868.65064号
[71] Verwer,J.G。;Hundsdorfer,W.H。;Sommeijer,B.P.,Runge-Kutta-Chebyshev方法的收敛性,数值。数学。,57/157-178(1990年)·Zbl 0697.65072号
[72] Verwer,J.G。;Sommeijer,B.P.,扩散反应方程的隐式显式Runge-Kutta-Chebyshev格式,SIAM J.Sci。计算。,25, 1824-1835 (2004) ·Zbl 1061.65090号
[73] Virtanen,P。;Gommers,R。;Oliphant,T.E。;Haberland,M.,SciPy 1.0:Python中科学计算的基本算法,《自然方法》,17,261-272(2020)
[74] 山崎,I。;托莫夫,S。;Dongarra,J.,混合精度Cholesky QR分解及其在多GPU多核CPU上的案例研究,SIAM J.Sci。计算。,37、C307-C330(2015)·Zbl 1320.65046号
[75] Yang,L.M。;福克斯,A。;Sanders,G.,混合精度块householder QR算法的舍入误差分析,SIAM J.Sci。计算。,43,A1723-A1753(2021)·Zbl 1512.65066号
[76] 郑,Z。;Petzold,L.R.,Runge-Kutta-Chebyshev投影法,J.计算。物理。,219, 976-991 (2006) ·Zbl 1103.76048号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。