摘要
溴0010 Tristan Carrier Baudouin、Jean-François Remacle、Emilie Marchandise、Francois Henrotte、Christophe Geuzaine,六边形网格生成的正面方法,高级模型。 模拟。 工程科学。, 1 (2014) 1-30. 谷歌学者 交叉引用 br0020型 Steven E.Benzley、Ernest Perry、Karl Merkley、Brett Clark、Greg Sjaardama,《弹性和弹塑性分析中所有六角形和四面体有限元网格的比较》,载于:《第四届国际网格圆桌会议论文集》,第17卷,Sandia National Laboratories,Albuquerque,NM,1995年,第179-191页。 谷歌学者 br 0030个 Cris Cecka、Adrian J.Lew、Eric Darve,《有限元方法在图形处理器上的组装》,国际数值杂志。 方法工程,85(2011)640-669。 谷歌学者 交叉引用 溴0040 Michel O.Deville,Paul F.Fischer,Ernest H.Mund,《不可压缩流体流动的高阶方法》,第9卷,剑桥大学出版社,2002年。 谷歌学者 0050比尔 Paul F.Fischer,不可压缩Navier-Stokes方程谱元解的重叠Schwarz方法,J.Compute。 物理。, 133 (1997) 84-101. 谷歌学者 数字图书馆 布尔0060 Paul F.Fischer,H.M.Tufo,N.I.Miller,三维不可压缩流动谱元模拟的重叠Schwarz方法,收录于:偏微分方程的并行解,Springer,2000年,第159-180页。 谷歌学者 0070英镑 Fu Zhisong,T.James Lewis,Robert M.Kirby,Ross T.Whitaker,为gpu设计有限元方法管道,J.Compute。 申请。 数学。, 257 (2014) 195-211. 谷歌学者 数字图书馆 0080比尔 Rajesh Gandham,Ken Esler,Yongpeng Zhang,GPU加速聚合代数多重网格方法,计算。 数学。 申请。, 68(2014)1151-1160。 谷歌学者 数字图书馆 br0090型 Rajesh Gandham,D.S.Medina,Timothy Warburton,GPU,浅水方程的加速间断Galerkin方法,Commun。 计算。 物理学。 (2015). 谷歌学者 邮编:0100 Christophe Geuzaine,Jean-François Remacle,Gmsh:一个具有内置预处理和后处理设施的三维有限元网格生成器,国际数学家杂志。 方法工程,79(2009)1309-1331。 谷歌学者 交叉引用 br0110型 Markus Geveler,D.Ribbrock,D.Göddeke,P.Zajac,S.Turek,面向基于gpu的完整fem仿真工具包:基于稀疏近似逆的强平滑器的非结构化网格有限元几何多重网格求解器,计算。 《流体》,80(2013)327-332。 谷歌学者 交叉引用 溴0120 Dominik Göddeke,用于GPU集群PDE模拟的快速准确有限元多重网格解算器,Logos Verlag Berlin GmbH,2011年。 谷歌学者 br0130号 Dominik Göddeke、Robert Strzodka、Jamaludin Mohd-Yusof、Patrick McCormick、Sven H.M.Buijssen、Matthias Grajewski、Stefan Turek,探索gpu增强集群上有限元计算的弱可扩展性,并行计算。, 33 (2007) 685-699. 谷歌学者 数字图书馆 br0140号 Koen Hillewaert,Nicolas Chevaugeon,Philippe Geuzaine,Jean-François Remacle,稳态Euler方程间断Galerkin解的分层多重网格迭代策略,国际数值杂志。 方法流体,51(2006)1157-1176。 谷歌学者 交叉引用 溴0150 Matthew G.Knepley,Andy R.Terrel,gpus上的有限元积分,ACM Trans。 数学。 柔和。 (TOMS),39(2013)10。 谷歌学者 数字图书馆 br0160型 G.R.Markall、A.Slemmer、D.A.Ham、P.H.J.Kelly、C.D.Cantwell、S.J.Sherwin,《多核和多核架构上的有限元组装策略》,国际数学家杂志。 方法流体,71(2013)80-97。 谷歌学者 交叉引用 br0170型 David S.Medina,Amik St-Cyr,T.Warburton,OCCA:多线程语言的统一方法。 arXiv:1403.0968号 谷歌学者 溴0180 David S.Medina、Amik St-Cyr、Timothy Warburton,使用OCCA的多线程架构的高阶有限差分。 arXiv:1410.1387 谷歌学者 溴0190 A.Modave,A.St-Cyr,T.Warburton,W.A.Mulder,地震波传播的加速非连续Galerkin时域模拟,2015年第77届EAGE会议和展览。 谷歌学者 交叉引用 溴0200 Yvan Notay,一种基于聚合的代数多重网格方法,Electron。 变速器。 数字。 分析。, 37 (2010) 123-146. 谷歌学者 br0210型 卢卡·帕瓦里诺(Luca F.Pavarino),《变形有限元法的加法Schwarz方法》,数值。 数学。, 66 (1993) 493-515. 谷歌学者 数字图书馆 br0220(巴西) M.A.Puso,J.Solberg,一个稳定的节点积分四面体,Int.J.Numer。 方法工程,67(2006)841-867。 谷歌学者 交叉引用 0230英镑 Soji Yamakawa,Kenji Shimada,通过填充矩形实心单元进行方向性控制的全自动六角优势网格生成,Int.J.Numer。 方法工程,57(2003)2099-2129。 谷歌学者 交叉引用
建议
GPU加速生成正确舍入的初等函数 IEEE 754-2008标准建议对一些基本函数进行正确舍入。 这需要解决Table Maker的困境(TMD),这意味着需要大量的CPU计算时间。 在本文中,我们考虑加速此类。。。