×

求解单尺度和多尺度微分方程的混合精度显式稳定Runge-Kutta方法。 (英语) Zbl 07540376

摘要:混合精度算法将低精度和高精度计算结合起来,以便在不牺牲精度的前提下从降低精度的性能增益中获益。在这项工作中,我们设计了混合精度Runge-Kutta-Chebyshev(RKC)方法,其中高精度用于精度,低精度用于稳定性。一般来说,RKC方法是稳定域随函数求值次数二次增长的低阶显式格式。因此,大部分的计算工作都花在稳定性上,而不是精度上。在本文中,我们证明了任何Runge-Kutta格式的一个幼稚的混合精度实现都会损害该方法的收敛阶并限制其精度,并且我们引入了一类新的混合精度RKC格式,它们不受这种限制行为的影响。我们提出了三种混合精度格式:一阶和二阶RKC方法,以及一阶多速率RKC格式。这些方案仅在高精度下执行精度所需的少数函数评估(一阶和二阶方法分别为1或2),而其余的则在低精度下执行。我们证明,虽然这些方法本质上与它们的完全低精度等价物一样便宜,但它们保持了它们的高精度对应物的稳定性和收敛顺序。实际上,数值实验证实了这些格式与相应的高精度方法一样精确。

理学硕士:

65公升 常微分方程的数值方法
65磅 数值线性代数
65毫米x 偏微分方程、初值和时变初边值问题的数值方法
PDF格式 BibTeX公司 XML 引用

参考文献:

[1] 阿布德法塔赫,A。;Anzt,H。;例如,波曼。;卡森E。;科让,T。;东加拉,J。;福克斯,A。;盖茨,M。;新泽西州海姆市。;李学森,应用混合精度算法的数值线性代数方法研究,国际期刊,高性能。计算机。申请。,35344-369年(2021年)
[2] 阿杜勒,A.,具递推关系的四阶切比雪夫方法,暹罗科学杂志。计算机。,2041-2054年(2002年)·Zbl 1009.65048
[3] 阿卜杜勒,A。;阿尔穆斯利马尼,I。;Vilmart,G.,刚性和遍历随机微分方程弱阶最优显式稳定积分器,暹罗J.不确定性。量化。,6937-964(2018年)·Zbl 1392.65013号
[4] 阿卜杜勒,A。;格罗特,M.J。;Rosilho de Souza,G.,刚性微分方程的显式稳定多速率方法,数学。计算机。(2022年),正在出版
[5] 阿卜杜勒,A。;Li,T.,S-ROCK stiff ItôSDEs的方法,公社。数学。科学。,6845-868(2008年)·Zbl 1162.60330号
[6] 阿卜杜勒,A。;Medovikov,A.A.,基于正交多项式的二阶切比雪夫方法,数值。数学。,2001年1月18日至18日·Zbl 0997.65094
[7] 阿卜杜勒,A。;Rosilho de Souza,G.,刚性随机微分方程的显式稳定多速率方法,暹罗J.Sci。计算机。(2022年),正在出版
[8] 阿卜杜勒,A。;维尔马特,G。;张志强,张志强,等.刚性随机微分方程的弱二阶显式稳定化方法,上海理工大学学报。计算机。,35,A1792-A1814(2013年)·Zbl 1281.65005型
[9] 阿克曼,J。;杜本,P.D。;帕默,T.N。;Smolarkiewicz,P.K.,全球地球物理流中线性解算器的混合精度(2021),arXiv预印本
[10] 阿古洛,E。;卡佩罗,F。;Di,S。;吉劳德,L。;梁某。;Schenkels,N.,通过数值线性代数中的有损压缩技术探索可变精度存储:对灵活GMRES的首次应用(2020),Inria Bordeaux Sud Ouest博士论文
[11] Almuslimani,I.,对流扩散反应问题的完全自适应显式稳定积分器(2022)
[12] P、 Amestoy,O.Boiteau,A.Buttari,M.Gerest,F.Jézéquel,J.Y.l'Excellent,T.Mary,2021,混合精度低秩近似及其在块低秩lu分解中的应用。
[13] P、 Amestoy,A.Buttari,N.J.Higham,J.Y.l'Excellent,T.Mary,B.Vieuble,2021年,基于五精度GMRES的迭代求精。
[14] 巴莱,S。;Abhyankar,S。;亚当斯,M。;布朗,J。;中华人民共和国布鲁内。;布什曼,K。;埃克霍特,V。;格罗普,W。;考希克,D。;Knepley,M.G.,PETSc用户手册第3.8版(2017年),阿贡国家实验室(ANL),技术报告
[15] 比约克。;佩吉,C.C.,《修正的Gram-Schmidt算法中正交性的丢失和恢复》,暹罗J.矩阵分析。申请。,13176-190(1992年)·Zbl 0747.65026
[16] 布兰查德,P。;新泽西州海姆市。;洛佩兹,F。;玛丽,T。;李志明,等,混合精密分块融合乘法加法:误差分析及在GPU张量核上的应用,暹罗科学院。计算机。,42,C124-C141(2020年)·Zbl 1452.65425
[17] 布里格斯,W.L。;亨森,V.E。;McCormick,S.F.,多重网格教程(2000),暹罗·Zbl 0958.65128号
[18] 伯内特,B。;戈特利布,S。;格兰特,Z.J。;Heryudono,A.,混合精度Runge-Kutta方法的性能评估(2021年)
[19] 卡尔,C。;霍克布鲁克,M。;Sturm,A.,关于蛙跳切比雪夫方案,暹罗J.Numer。肛门。,582404-2433(2020年)·Zbl 1454.65046
[20] 卡森E。;海姆,N.J.,《迭代求精的新分析及其在病态稀疏线性系统精确解中的应用》,暹罗科学出版社。计算机。,39,A2834-A2856(2017年)·Zbl 1379.65019
[21] 卡森E。;Higham,N.J.,用三种精度的迭代求精加速线性方程组的求解,暹罗J.Sci。计算机。,40,A817-A847(2018年)·Zbl 1453.65067
[22] 康诺利,医学博士。;新泽西州海姆市。;Mary,T.,随机舍入及其概率向后误差分析(2020),曼彻斯特大学:曼彻斯特大学,技术报告
[23] Croci,M.,Libchopping–C++和Python中的并行低精度仿真器(2019)
[24] 克罗西,M。;法西,M。;新泽西州海姆市。;玛丽,T。;《随机舍入:实现、误差分析与应用》,R.Soc.开放科学。,第9条,第211631页(2021年)
[25] 克罗西,M。;Giles,M.B.,低精度热方程数值解中舍入到最近点和随机舍入的影响(2020年),技术报告
[26] 达斯,D。;北梅勒姆普迪。;穆迪格尔,D。;卡拉姆卡尔,D。;Avancha,S。;班纳吉,K。;斯里德哈兰S。;瓦迪亚纳坦,K。;考尔,B。;Georganas,E.,使用整数运算对卷积神经网络进行混合精度训练(2018),arXiv预印本
[27] Dembo,R.S。;南卡罗来纳州艾森斯塔特。;Steihaug,T.,不精确牛顿方法,暹罗J.数字。肛门。,19400-408年(1982年)·Zbl 0478.65030
[28] 杜本,P.D。;Subramanian,A。;道森,A。;Palmer,T.,《使用OpenIFS模型中的硬件仿真器降低数值精度以使超参数化更具竞争力的研究》,J.Adv.模型。接地系统。,9566-584(2017年)
[29] 杜蒙,T。;杜阿尔特,M。;德索姆贝斯。;德隆,文学硕士。;Massot,M。;Louvet,V.,《模拟人体缺血性中风的逼真3D几何》,Commun。非线性科学。数字。模拟。,18539-1557(2013年)·Zbl 1322.92019号
[30] 法尔古特,R.D。;Yang,U.M.,Hypre:高性能预处理程序库,(国际计算科学会议(2002),第632-641页·Zbl 1056.65046
[31] Grant,Z.J.,混合精度应用的扰动Runge-Kutta方法(2020)
[32] 格拉顿,S。;西蒙,E。;蒂特利·佩洛奎因,D。;Toint,P.,利用GMRES中的可变精度(2019),arXiv预印本
[33] 格里万,A。;Walther,A.,《求导:算法微分的原理和技术》(2008),暹罗·Zbl 1159.65026
[34] 格罗特,M.J。;米歇尔,S。;Sauter,S.A.,基于稳定蛙跳的波动方程局部时间步进法,数学。计算机。,902603-2643(2021年)·Zbl 1493.65151
[35] 海尔,E。;麦克拉克伦,R.I。;Razakarivony,A.,用隐式Runge-Kutta方法实现Brouwer定律,位数字。数学。,48231-243(2008年)·Zbl 1148.65058
[36] 海尔,E。;Nörsett,S.P。;Wanner,G.,解常微分方程I,计算数学中的Springer级数,第8卷(2008),Springer Verlag:Springer Verlag Berlin
[37] 海尔,E。;Wanner,G.,《解常微分方程II》,第14卷(1996年),斯普林格-韦拉格-柏林-海德堡
[38] 哈里斯,C.R。;Millman,K.J.,数组编程与NumPy,Nature,585357-362(2020年)
[39] Henrici,P.,《常微分方程中的离散变量方法》(1962),约翰威利父子公司·Zbl 0112.34901
[40] Henrici,P.,《差分方法中的误差传播》(1963年),约翰威利父子公司·Zbl 0171.36104
[41] Higham,N.J.,《浮点求和的精度》,暹罗科学出版社。计算机。,14783-799(1993年)·Zbl 0788.65053
[42] Higham,N.J.,数值算法的精度和稳定性(2002),暹罗·Zbl 1011.65010
[43] 新泽西州海姆市。;Mary,T.,《概率舍入误差分析的新方法》,暹罗科学出版社。计算机。,412815-2835(2019年)
[44] 新泽西州海姆市。;Pranesh,S.,模拟低精度浮点运算,暹罗J.Sci。计算机。,41,C585-C602(2019年)·Zbl 07124603
[45] 新泽西州海姆市。;普拉内斯,S。;邹农,M.,《将矩阵压缩成半精度,及其在求解线性系统中的应用》,暹罗J.Sci。计算机。,41,A2536-A2551(2019年)·Zbl 1420.65017
[46] 克尔沃,M。;杜本,P。;Palmer,T.,《用浅水模型分析天气和气候模型中16位算法的数字格式、误差缓解和范围》,J.Adv.model。接地系统。,12,第E2020MS00246页(2020年)
[47] 克尔沃,M。;哈特菲尔德。;克罗西,M。;杜本,P.D。;Palmer,T.N.,流体模拟用16位加速:通过挤压浅水水域,A64FX的加速速度接近4倍。jl into Float16,J.Adv.模型。接地系统。,14,第e2021MS002684页(2022年)
[48] 兰格,M。;Rump,S.M.,实数求和的误差估计及其在浮点求和中的应用。数学。,57927-941(2017年)·Zbl 1380.65083
[49] Lebedev,V.I.,如何用显式方法求解刚性微分方程组,(Numer.methods Appl.(1994),CRC:CRC Boca Raton,FL),45-80·Zbl 0851.65052
[50] 列别杰夫,维吉尼亚州。;Medovikov,A.A.,求解刚性常微分方程组的二阶显式方法,Russ,Acad。科学。(1994年)
[51] 林德伯格,B.,IMPEX:刚性微分方程组求解的程序包(1972),皇家理工学院信息处理系:斯德哥尔摩皇家理工学院信息处理系,技术报告
[52] Logg,A。;马达尔,K.A。;Wells,G.,用有限元方法自动求解微分方程:FEniCS图书,第84卷(2012),Springer科学与商业媒体·兹布1247.65105
[53] 洛佩兹,F。;Mary,T.,GPU张量核心的混合精度LU分解:减少数据移动和内存占用(2020),曼彻斯特大学,技术报告
[54] 麦考密克公司。;本扎肯,J。;Tamstorf,R.,混合精度多网格解算器的代数误差分析,暹罗J.Sci。计算机。,S392-S419(2021年)·Zbl 07418113号
[55] Medovikov,A.A.,抛物型方程的高阶显式方法,位数字。数学。,38372-390(1998年)·Zbl 0909.65060
[56] 北梅勒姆普迪。;斯里尼瓦桑。;达斯,D。;Kaul,B.,8位浮点混合精度训练(2019),arXiv预印本
[57] 米兰特,G。;斯特拉科什,Z.,有限精度算法中的Lanczos和共轭梯度算法,Acta Numer。,15471-542(2006年)·Zbl 1113.65032
[58] 梅耶,哥伦比亚特区。;巴尔萨拉博士。;Aslam,T.D.,抛物方程和混合方程显式超时间步进的稳定Runge-Kutta-Legendre方法,J.Compute。物理。,257594-626(2014年)·Zbl 1349.65520号
[59] 米奇维修斯,P。;纳朗,S。;阿尔本,J。;迪亚莫斯,G。;埃尔森E。;加西亚,D。;金斯堡,B。;休斯顿,M。;库恰耶夫,O。;Venkatesh,G.,混合精度训练(2017),arXiv预印本
[60] 帕克斯顿,E.A。;尚特里,M。;克尔沃,M。;萨芬,L。;Palmer,T.,低精度气候模拟:确定性和随机取整的影响(2021),arXiv预印本
[61] Rosilho de Souza,G.,《通过投影方法和微分代数方法对不可压缩Navier-Stokes方程的稳定化显式Runge-Kutta方法的应用》(2014),EPFL,硕士论文
[62] Sommeijer公司。;萨姆平,L。;Verwer,J.G.,RKC:抛物线偏微分方程的显式解算器,J.Comput。申请。数学。,88315-326(1998年)·Zbl 0910.65067
[63] 塔姆斯托夫,R。;本扎肯,J。;McCormick,S.F.,离散化误差精确混合精度多网格解算器,暹罗J.Sci。计算机。,S420-S447(2021年)·Zbl 07418114
[64] 唐,X。;肖,A.,改进的龙格库塔切比雪夫方法,数学。计算机。模拟。,17459-75(2020年)·Zbl 1453.65168
〔65〕 吴国荣,等.广义特征值问题的浮点数算法与迭代求精法.矩阵分析。申请。,221038-1057(2001年)·Zbl 0982.65040
[66] 范德豪文,P.J。;Sommeijer,B.P.,《大m值显式m阶段Runge-Kutta方法的内部稳定性》,Z.Angew。数学。机械。,60479-485(1980年)·Zbl 0455.65052
[67] Vňa,F。;杜本,P。;朗,S。;帕默,T。;Leutbecher,M。;萨蒙德,D。;Carver,G.,《天气预报模型的单精度:与IFS的评估》,Mon。天气评论,145495-502(2017)
[68] Verwer,J.G.,抛物型方程时间积分的一类稳定显式方法的实现,ACM Trans。数学。软性。,6188-205年(1980年)·Zbl 0431.65069
〔69〕 Verwer,J.G.,《关于Runge-Kutta-Chebyshev方法的注记》,Z.Angew。数学。机械。,62561-563(1982年)·Zbl 0531.65040
[70] 韦维尔,J.G.,抛物型偏微分方程的显式龙格库塔方法,应用。数字。数学。,22359-379(1996年)·Zbl 0868.65064
[71] 韦维尔,J.G。;亨多弗,W.H。;苏美杰,B.P.,龙格-库塔-切比雪夫方法的收敛性,数值。数学。,57157-178(1990年)·Zbl 0697.65072
[72] 韦维尔,J.G。;张国平,张国宝,扩散反应方程的隐式显式龙格库塔-切比雪夫格式,上海理工大学学报。计算机。,1824-1835年(2004年)·Zbl 1061.65090
[73] 维塔宁,P。;戈默斯,R。;奥列芬特,T.E。;Haberland,M.,Scipy1.0:科学计算的基本算法,Nat.方法,17261-272(2020)
[74] 山崎,I。;托莫夫,S。;董加拉,J.,《混合精度Cholesky-QR分解及其在多核处理器上的应用实例研究》,暹罗理工大学学报。计算机。,37,C307-C330(2015年)·Zbl 1320.65046
[75] 杨,L.M。;福克斯,A。;Sanders,G.,混合精度块householder QR算法的舍入误差分析,暹罗科学院。计算机。,43,A1723-A1753(2021年)·Zbl 07364332
[76] 郑,Z。;佩佐德,L.R.,龙格-库塔-切比雪夫投影法,计算机。物理。,219976-991(2006年)·Zbl 1103.76048
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。