×

大微分系统波形松弛法的GPU加速。 (英语) Zbl 1333.65076号

摘要:本文的目的是为大型常微分方程组的数值求解提供一种波形松弛加速(WR)方法。该技术基于图形处理单元(GPU)的使用,以加快数值积分过程。提出了一种基于WR-Picard、WR-Jacobi和红黑WR-Gauss-Seidel迭代的CUDA求解器,并提供了在多GPU机器上实现的一些数值实验。

MSC公司:

65升05 常微分方程初值问题的数值方法
34A30型 线性常微分方程组
2005年5月 并行数值计算
65升20 常微分方程数值方法的稳定性和收敛性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Burrage,K.:常微分方程的并行和序贯方法。数值数学和科学计算。牛津大学出版社,纽约(1995)·Zbl 0838.65073号
[2] Burrage,K.,Dyke,C.,Pohl,B.:关于微分系统并行波形松弛的性能。申请。数字。数学。20(1-2), 39-55 (1996) ·Zbl 0855.65074号 ·doi:10.1016/0168-9274(95)00116-6
[3] Burrage,K.,Jackiewicz,Z.,Norsett,S.P.,Renaut,R.A.:微分系统的预处理波形松弛迭代。BIT 36(1),54-76(1996)·Zbl 0864.65049号 ·doi:10.1007/BF01740544
[4] Burrage,K.,Sand,J.:常微分方程的雅可比波形松弛方法。SIAM J.科学。计算。20(2), 534-552 (1998) ·Zbl 0923.65045号 ·doi:10.1137/S1064827596306562
[5] Capobianco,G.,Cardone,A.:阿贝尔型Volterra积分方程大系统的并行算法。J.计算。申请。数学。220, 749-758 (2008). doi:10.1016/j.cam.2008.05.026·兹比尔1146.65083 ·doi:10.1016/j.cam.2008.05.026
[6] Capobianco,G.,Conte,D.:Abel型Volterra积分方程的高效快速并行方法。J.计算。申请。数学。189/1-2, 481-493 (2006). doi:10.1016/j.cam.2005.03.056·Zbl 1101.65117号 ·doi:10.1016/j.cam.2005.03.056
[7] Capobianco,G.,Conte,D.,Del Prete,I.:弱奇异核Volterra方程的高性能数值方法。J.计算。申请。数学。228, 571-579 (2009). doi:10.1016/j.cam.2008.03.027·Zbl 1169.65118号 ·doi:10.1016/j.cam.2008.03.027
[8] Cardone,A.、Messina,E.、Russo,E.:离散Volterra-Fredholm积分方程的快速迭代方法。J.计算。申请。数学189,568-579(2006)·Zbl 1092.65118号 ·doi:10.1016/j.cam.2005.05.018
[9] Cardone,A.,Messina,E.,Vecchio,A.:半直线上Volterra-Fredholm积分方程的自适应方法。J.计算。申请。数学。228 (2), 538-547 (2009) ·Zbl 1184.65119号 ·doi:10.1016/j.cam.2008.03.036
[10] Conte,D.,D'Ambrosio,R.,Jackiewicz,Z.:具有二次稳定函数的两步Runge-Kutta方法。科学杂志。计算。44(2), 191-218 (2010) ·Zbl 1203.65107号 ·数字对象标识代码:10.1007/s10915-010-9378-x
[11] Conte,D.,D'Ambrosio,R.,Jackiewicz,Z.,Paternoster,B.:推导代数稳定的两步Runge-Kutta方法的实用方法。数学。模型。分析。17(1), 65-77 (2012) ·Zbl 1246.65109号 ·数字标识代码:10.3846/13926292.2012.644870
[12] Conte,D.,D'Ambrosio,R.,Jackiewicz,Z.,Paternoster,B.:代数稳定的两步连续Runge-Kutta方法的数值搜索。J.计算。申请。数学。239, 304-321 (2013) ·Zbl 1255.65130号 ·doi:10.1016/j.cam.2012.08.012
[13] Conte,D.,D’Ambrosio,R.,Paternoster,B.:Volterra积分方程的基于对角隐式配置的两步方法。申请。数字。数学。62 (10), 1312-1324 (2012). doi:10.1016/j.apnum.2012.06.07·Zbl 1251.65172号 ·doi:10.1016/j.apnum.2012.06.07
[14] Conte,D.,Jackiewicz,Z.,Paternoster,B.:Volterra积分方程的两步几乎配置方法。申请。数学。公司。204, 839-853 (2008) ·Zbl 1160.65066号 ·doi:10.1016/j.amc.2008.07.026
[15] Conte,D.,Paternoster,B.:Volterra积分方程的多步配置方法。申请。数字。数学。59, 1721-1736 (2009) ·Zbl 1172.65069号 ·doi:10.1016/j.apnum.2009.01.01
[16] Courvoisier,Y.,Gander,M.J.:短时间窗内Schwarz波形松弛的优化。数值算法64(2),221-243(2013)·Zbl 1273.65135号 ·doi:10.1007/s11075-012-9662-y
[17] Crisci,M.R.,Paternoster,B.,Russo,E.:具有振荡解的ODE的完全并行Runge-Kutta-NyströM方法。申请。数字。数学。11(1-3), 143-158 (1993) ·Zbl 0782.65090号 ·doi:10.1016/0168-9274(93)90045-S
[18] D'Ambrosio,R.,Ferro,M.,Jackiewicz,Z.,Paternoster,B.:常微分方程的两步近似配置方法。数字。算法53(2-3),195-217(2010)·Zbl 1186.65107号 ·doi:10.1007/s11075-009-9280-5
[19] D'Ambrosio,R.,Jackiewicz,Z.:常微分方程的连续两步Runge-Kutta方法。数字。算法54(2),169-193(2010)·Zbl 1191.65092号 ·doi:10.1007/s11075-009-9329-5
[20] D'Ambrosio,R.,Jackiewicz,Z.:刚性微分系统的高稳定两步连续方法的构造和实现。数学。计算。模拟。81(9), 1707-1728 (2011) ·Zbl 1220.65096号 ·doi:10.1016/j.matcom.2011.01.005
[21] D'Ambrosio,R.,Paternoster,B.:常微分方程结构系数矩阵的两步修正配置方法。申请。数字。数学。62(10), 1325-1334 (2012) ·Zbl 1251.65115号 ·doi:10.1016/j.apnum.2012.06.08
[22] Davison,E.J.:一种用于超大动态系统计算机模拟的算法。Automatica 9,665-675(1973)·Zbl 0269.65042号 ·doi:10.1016/0005-1098(73)90026-5
[23] Enright,W.:关于O.D.E.大型线性系统的高效可靠数值解。IEEE传输。自动。控制AC-24(6),905-908(1979)·Zbl 0416.93052号 ·doi:10.10109/TAC.1979.1102179
[24] Everstine:PDE的数值解,gwu.geverstine.com/pdenum.pdf(2010)·Zbl 0782.65090号
[25] http://gpgpu.org/category/research ·Zbl 1273.65135号
[26] 网址:http://gpucomputing.net/
[27] Hairer,E.,Norsett,S.P.,Wanner,G.:求解常微分方程。I.非刚性问题。第二版。施普林格计算数学系列,8。柏林斯普林格·弗拉格(1993)·兹比尔0789.65048
[28] Hairer,E.,Wanner,G.:求解常微分方程。二、。刚性和微分代数问题。第二次修订版,平装本。计算数学中的斯普林格级数,14。柏林施普林格-弗拉格出版社(2010年)·Zbl 1192.65097号
[29] Jackson,K.R.,Norsett,S.P.:Runge-Kutta方法中并行性的潜力。第1部分:标准形式的RK公式。SIAM J.Numer。分析。32, 49-82 (1990) ·Zbl 0826.65073号 ·doi:10.1137/0732002
[30] Janssen,J.:线性常微分方程和偏微分方程波形松弛方法的加速,博士论文。比利时鲁汶卡索利克大学(1997)
[31] Lelarasmee,E.:《大尺度非线性系统时域分析的波形松弛方法》,电气工程与计算机科学系博士论文。加州大学伯克利分校(1982)
[32] Leimkuhler,B.:估计波形松弛收敛。SIAM J.科学。计算。14, 872-889 (1993) ·Zbl 0787.65039号 ·doi:10.1137/0914054
[33] Leimkuhler,B.,Ruehli,A.:波形松弛的快速收敛。申请。数字。数学。11(1-3), 211-224 (1993) ·Zbl 0789.65051号 ·doi:10.1016/0168-9274(93)90049-W
[34] Lopez,L.:基于边值技术的方法,用于在并行计算机上求解抛物方程。并行计算。19(9), 979-991 (1993) ·Zbl 0780.65062号 ·doi:10.1016/0167-8191(93)90091-X
[35] Lopez,L.,Politi,T.:人口动态模型数值处理中的并行方法。并行计算。18(7), 767-777 (1992) ·兹比尔0760.65112 ·doi:10.1016/0167-8191(92)90043-7
[36] Lopez,L.,Politi,T.:带状线性系统的调节和并行解中的三对角分裂。线性代数应用。251, 249-265 (1997) ·Zbl 0871.65024号 ·doi:10.1016/0024-3795(95)00694-X
[37] Lopez,L.,Trigiante,D.:具有空间扩散的种群动力学模型的数值解中出现的刚性问题的有限差分格式。非线性分析。9(1), 1-12 (1985) ·兹比尔0572.65075 ·doi:10.1016/0362-546X(85)90048-3
[38] Miekkala,U.,Nevanlinna,O.:初值问题动态迭代的收敛性。SIAM J.科学。统计成分。8, 459-482 (1987) ·Zbl 0625.65063号 ·doi:10.1137/0908046
[39] Miekkala,U.,Nevanlinna,O.:线性微分方程组的迭代解。《数值学报》5,259-307(1996)·Zbl 0870.65059号 ·doi:10.1017/S096249290000266X
[40] 英伟达公司:英伟达CUDA计算统一设备架构编程指南,http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf(2012年)·Zbl 0855.65074号
[41] Ortega,J.:线性系统的并行和向量解导论Springer(1988)·Zbl 0669.65017号
[42] Quarteroni,A.,Valli,A.:偏微分方程的数值逼近。计算数学中的斯普林格级数,23。柏林施普林格-弗拉格出版社(1994年)·Zbl 0803.65088号
[43] Reichelt,M.,White,J.,Allen,J.:二维MOS器件瞬态模拟的波形弛豫。摘自:IEEE国际比较辅助设计会议论文集(1989年)·Zbl 1146.65083号
[44] Sanders,J.,Kandrot,E.:CUDA示例,通用GPU编程简介,NVIDIA Corporation。艾迪森·韦斯利(2011)
[45] Simek,V.,Dvorak,R.,Zboril,F.,Kunovsky,J.:使用CUDA加速计算大气方程,UKSIM’09第11届计算机建模与模拟国际会议,第449-454页(2009)
[46] Spiteri,R.J.,Dean,R.C.:关于心脏电活动模型中隐式-显式Runge-Kutta方法的性能。IEEE传输。生物识别。工程55(5),1488-1495(2008)·doi:10.1109/TBME.2007.914677
[47] van der Houwen,P.J.,Sommeijer,B.P.:CWI对并行Runge-Kutta方法开发的贡献。申请。数字。数学。22(1-3), 327-344 (1996) ·兹伯利0868.65042 ·doi:10.1016/S0168-9274(96)00047-5
[48] Van Lent,J.,Vandewalle,S.:各向异性偏微分方程的多重网格波形松弛。数字。算法31(1-4),361-380(2002)·Zbl 1012.65099号 ·doi:10.1023/A:1021191719400
[49] Zhang,H.,Jiang,Y.-L.:关于热方程重叠Schwarz波形松弛方法H1收敛性的注记。数字。算法66(2),299-307(2014)·兹比尔1295.65091 ·doi:10.1007/s11075-013-9734-7
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。